未来的云计算是什么样的?阿里云用全新的“飞天+CIPU体系”,对这个问题给出了充满想象力的回答。
在今年的阿里云峰会上,阿里云发布了一款云数据中心专用处理器CIPU。阿里云智能总裁张建锋表示,CIPU是一款阿里云自研的新型云数据中心专用处理器,未来将替代CPU成为云计算的管控和加速中心。
据介绍,CIPU具备三大特性:首先,CIPU具备对高带宽物理网络进行“超级”加速的能力,云数据中心可以以CIPU为基础,建设大规模的eRDMA分布式高性能网络,让连接服务器的物理网络实现传输能力的倍增,充分发挥服务器的性能;其次,CIPU对存储设备的读写吞吐能力具备硬件加速能力,在CIPU的加持下,存算分离架构的数据中心可提供空前高速的云盘访问能力;第三,对于不同类型资源的阿里云神龙计算平台来说,CIPU还具有快速接入能力,并能够通过高效整合,将算力的损耗整合降至接近“0”的水平。
正是基于这三大特性,CIPU可以向下对数据中心的计算、存储、网络资源快速云化并进行硬件加速,向上则能接入阿里的飞天云操作系统,将全球数百万台服务器连成一台超级计算机。
事实上,改变以硬件为主导的传统IT体系,从而建立以云为主导的新体系,是每一个云厂商的技术理想。而在当下,这已是实实在在的迫切需求:一方面,以AI为代表的新兴计算场景所需算力爆增。数据显示,自2012年以来,AI训练任务所需要的计算力每3.43个月就会翻一倍,六年以来累计暴涨超过30万倍,远远超过了摩尔定律的极限,以CPU为中心的传统IT体系已无法满足日益增长的算力需求;另一方面,随着自动驾驶、虚拟人等对低延迟、高带宽需求敏感的应用场景增多,用户对于云服务的速度、效率、稳定性都提出了更为极致的要求。
此外,随着云计算应用的快速普及,越来越多应用场景开始从“南北向流量”演进为“东西向流量”,数据中心内部传输的数据量激增,使得大规模数据的传输与搬迁成为限制云计算发展的又一难题。
针对此,阿里云推出了“飞天云+CIPU”的新架构体系,试图解决当下云计算厂商普遍面临的瓶颈问题。
张建锋说,过去十多年,云计算技术经历了两个发展阶段:第一阶段是分布式和虚拟化技术替代了大型机、小型机,满足了当时企业业务扩展带来的算力弹性需求;第二阶段出现了资源池化技术,通过把计算和存储进行分离,而后规模化编排和调度,形成了超大规模的计算和存储资源池。
这两个阶段的演进推动了云计算的发展,但它们都是通过软件定义的方法,基于传统的以CPU为中心的体系架构去做优化,目前已经触及瓶颈。
近年来,云上客户的需求已发生较大变化,数据密集型的计算越来越多,对云计算提供的低时延、高带宽的需求却在不断提高,但这些需求很难通过传统体系结构去满足。也就是说,从用户需求来看,当前的云计算无论是架构方法论还是实际应用情况,都已经无法适应市场发展的需要。
因此,张建锋认为,新一代云计算要从数据中心的内部做体系化创新,从以往以CPU为中心的体系架构,进入以CIPU为中心的体系架构。他说,阿里云今年最重要策略是“B2B”,即“BacktoBasic”,阿里云要回到云计算的本质,坚持在技术的长征路上,不断取得新的突破,“现在是重新定义云的窗口期,如果我们定义好下一代的云,中国云计算就有超车机会。”