Page 38 - 网络电信2016第17期
P. 38
解决方案
架构下将比传统Hadoop提升37.8倍和114倍[12]。 关资源,实现完全意义上业务驱动的软件定义数据中心。
3.可重构技术 1.第1代融合架构
可重构技术可以分为数据中心级、系统级和芯片级3个层 第1代融合基础架构的特征是实现散热、电源、管理等非IT
次,芯片级的可重构即是根据应用的需求进行芯片功能重构。 资源的集中化和模块化,如图3所示。与传统架构相比,集中供
随着3D晶体管工艺的推广应用,处理器芯片内部的晶体管资源 电能够提高系统供电效率,减少电源自身的损耗;集中散热不
更加丰富,可编程现场可编程门阵列(FPGA)的性能和容量也 但方便系统维护,而且能够降低系统散热功耗;对资源的集中
都大幅提升,使得面向特定应用重构硬件逻辑成为可能[13]。可 管理能够实现系统功耗监测控制、散热调控等智能化管理。
重构处理器既保持了处理器的通用性,又具备专用硬件逻辑的
高效率,以及逻辑可重构带来的灵活性。这实际上就是一种更 图3 第1代融合架构
细粒度的软件定义的资源重构,将对数据中心整体效率带来较
大提升。实现可重构的关键是应用逻辑的在线快速动态加载与
切换。将应用逻辑划分为通用静态逻辑和专用动态逻辑,如图2
所示。通用的静态逻辑可以预先配置,用于建立异构部件与CPU
的数据通路;而动态逻辑与应用特征有关,可以通过CPU与加速
部件的高速接口完成目标应用在线快速切换,从而在毫秒级内
完成逻辑动态重构。
图2 可重构异构部件架构
4.软件定义 第1代融合架构代表是参照美国开放计算项目(OCP)[15]
软件定义的基本思想是控制与基础设施分离,实现逻辑 和中国天蝎规范[16]研发的机柜级服务器,OCP和天蝎规范都针
集中的资源弹性调整、动态分配与可编程配置,也就是说将计 对机柜服务器的尺寸、空间、设施、供电等方面形成各自统一
算、存储、网络等基础设施资源化,作为随需提供的服务。 标准,已经在全球互联网巨头的数据中心广泛应用。例如,
目前,软件定义的关注重点正在从资源抽象和控制分离, Google每年采购量在40万节点,Facebook每年25万节点,中国
逐步扩展到业务感知能力。特别是在数据中心资源管理中引入 BATQ每年也都在10万节点以上。通过第1代融合架构应用,中国
机器学习技术,例如在模式识别、音/视频处理等领域广泛应用 互联网数据中心的空间利用率可以提升13.8%,能耗能降低15%
的深层神经网络[14],建立应用感知的资源重构决策系统,赋予 以上,总所有成本(TCO)降低10%,部署效率提高10倍,浪潮
基础设施感知上层应用需求、识别资源使用行为特征的能力, 在百度阳泉数据中心更是创造了单日部署1万节点的记录。
为业务构建最佳运行环境。
2.第2代融合架构
三、融合架构演进路线及应用 第2代融合基础架构在第1代基础上,基于高速互联构建
分布式网络,进一步将存储硬件池化,并通过软件定义实现资
实践融合架构的最终形态,就是硬件趋于一致,软件定义 源拓扑灵活定义、存储按需供给,如图4所示。第2代融合架构
一切。通过硬件重构,将各种资源融合到一个全新形态的设备 的典型代表是云服务器架构(CRA)。网络方面,CRA将传统网
中,再通过软件定义表现出计算、存储、网络、安全功能,派 卡、交换机取消,统一设计为统一网络引擎(UNE),每个UNE
生出科学计算、大数据和人机交互等业务,满足不同的智能制 链接4个节点,相互之间组成分布式网络构成一个机柜级交换核
造应用场景需求。具体到发展路线,我们认为可以从软、硬件2 心,实现与主干网络的连接。每个UNE对内有8个25G的外设部件
个层面演进,并分3个阶段逐步发展。
图4 第2代融合架构
(1)第1阶段,在硬件上实现散热、电源、管理功能等非
IT资源的集中化和模块化,并利用软件虚拟化实现计算、存储
等IT 资源的池化和集中管理。
(2)第2阶段,进一步将非计算部分的存储、网络等IO设
备进行池化,机柜内采用硅光电等技术进行高速互联,并以软
件定义的计算、存储和网络来满足业务需求。
(3)第3阶段是最终将CPU、内存等所有IT资源完全池化,
从硬件上可实现任意组合,根据应用需求智能地分配和组合相
46 网络电信 二零一六年十月