时下最火的技术莫过于“生成式 AI”,作为全球市场云计算的引领者亚马逊云科技更是未雨绸缪,为企业 AI 化做好充足的准备。在 2023 亚马逊云科技中国峰会上,亚马逊云科技不仅带来了“生成式 AI”的前瞻判断,更发布多项举措和产品创新来助力企业加速、可持续发展。
在 6 月 28 日的亚马逊云科技中国峰会现场,亚马逊云科技大中华区产品总经理陈晓建在《专注创新,摆脱基础架构束缚》主题演讲中提出,云服务是支持数字创新的关键生产力。在当前生成式 AI 技术爆发的大环境下,亚马逊云科技通过广泛和深入的基础架构服务和功能,全方位助力客户进行全球业务拓展,实现 AI 浪潮下的求新求变。亚马逊云科技全球产品副总裁 Matt Wood 博士在峰会上也分享了如何解锁生成式 AI 的核心价值,以及践行生成式 AI 方法论。
一、AI 技术爆发推动算力需求井喷 亚马逊云科技提供全面深入的算力支持
AI 和机器学习技术早已深入到了很多创新场景中。而今天,生成式 AI 的风潮,更是为企业带来更新的业务机会和效率提升,例如文本和图片的生成,代码生成等等。毫无疑问,生成式 AI 成为当下最被关注的创新技术,而 AI 技术的爆发直接推动了对算力资源的需求。面对重重挑战,亚马逊云科技大中华区产品总经理陈晓建在会上分享了亚马逊云科技如何通过提供至广至深的服务和功能,重新构建您的应用。
1、推出自研芯片,实现更高性价比
自第一款自研芯片 Amazon Nitro 推出以来,亚马逊云科技加速创“芯”,在整个计算实例变得越来越复杂、功能越来越强大的同时,不断专注于技术创新,提升产品效率。
总的来说,Nitro 做了三件事,第一,作为高度轻量化的虚拟化;第二,实现网络层面的数据通信和存储的隔离;第三,实现了硬件级别的加密。有了 Nitro 之后,EC2 整个实例应用的安全性大大增强,每个单元可以独立发展,同时也确保了 EC2 所有实例运行的稳定。最新一代 Nitro V5 芯片相比之前的芯片性能有大幅的提升,包括更快的转发率、更低的延迟,以及每瓦特性能提升40%。
亚马逊云科技也推出了基于 ARM 架构的通用处理器芯片 Graviton,Graviton 目前已经到了 3E,相比之前的 Graviton 产品,Graviton3E 计算性能提高25%,浮点性能提高2倍,加密工作负载性能加快2倍;Graviton3E 特别关注向量计算的性能,跟前一代相比提升了35%。这个性能提升对于像 HPC 高性能计算这样的应用来说尤为重要。
在实际应用中,Formula One 利用 Graviton3 运行空气动力学模拟,可以用比以往快70%的速度开发新一代赛车,赛车压力损失可以从50%降低到15% 。由于压力下降的损失可以使得车主的超车更容易,车迷可以带来更多赛场的缠斗。F1 通过5000多次单车和多车模拟,收集了超过5.5亿个数据点,帮助他们进行下一代赛车的优化。Formula One 表示:“Graviton3 让系统性能快了40%,可以晚间运行模拟,第二天早上就能得出结果。”
2、 弹性的计算存储组合,应对丰富的算力需求
亚马逊云科技提供超过 600 种的不同的计算实例:从处理器、存储、网络各种周边的服务能够和计算很好的结合,以积木的方式形成丰富的、灵活性的计算实例资源,满足多种不同算力要求。
除了自研芯片外,亚马逊云科技还提供了多达八种的存储的级别,无论是冷热温冻数据都可以找到合适的存储层级。Amazon S3 Intelligent-Tiering 独有全自动存储智能分层技术累计为全球用户节约超过 10 亿美元。
在实际应用中,亚马逊云科技为全球领先的综合性视觉效果公司维塔数码提供了从基础架构算力资源到云上制作堆栈、机器学习堆栈的一系列服务。维塔数码使用了包括 GPU 在内的大量计算实例,Spot 实例还为其提供了非常强的伸缩性以及很好的性价比。维塔数码表示:“《阿凡达1》,我们花了14个月看到了第一帧,《阿凡达2》,在八个月内,我们在云中拥有了33亿个线程小时。”
3、Serverless 架构,简化运维管理
有多种多样的芯片和高伸缩性的资源供给是不是就够了呢?用户还希望能降低云运维的复杂性,亚马逊云科技为用户提供了第三种武器 Serverless。亚马逊云科技自 2014 年发布 Lambda 以来,已经相继发布了105多种 Serverless 新技术,包括:解决 Java 应用冷启动问题的 Lambda SnapStart,可视化编辑器 Application Composer 等。用户可以根据应用的类型来选择不同的弹性和计算颗粒度,如果是通用计算,也许他们只用 EC2 就可以了,当然也可以使用像容器编排的 ECS 或 EKS,如果需要一个极致的弹性变化能力,亚马逊云科技有 Fargate 和 Lambda 可以提供极致弹性和极致性价比的产品。
在实际应用中,Second Dinner 采用亚马逊云科技的 Serverless 架构开发并构建了一款基于漫威 IP 的数字卡牌游戏《MARVEL SNAP》,在 2022 年风靡全球。整个游戏没有使用任何一台 EC2 计算实例或容器,全部由事件驱动架构实现,这不仅帮助用户节省了成本,加快了应用开发速度,还减少了安全方面隐患。
Second Dinner 工程副总裁 Aaron Brunstetter 表示,“我们之前运营、维护过许多款游戏,但从技术角度来看,毫无疑问,《MARVEL SNAP》是我们有史以来运营过的最顺利、最成功的游戏,这正是因为我们选择了亚马逊云科技。”最终《MARVEL SNAP》在启动时没有一个后端错误事件,这在游戏行业是闻所未闻的。
二、放眼全球布局 亚马逊云科技赋能企业迎接新机遇
全球化布局现已成为众多企业的重要发展战略。截至今天,亚马逊云科技在全球拥有 31 个区域的 99 个可用区,已经覆盖了 245 个国家和地区,全方位助力企业实现全球化布局。
1、无处不在的算力支持,让创新速达每一个角落
在大多数情况下,亚马逊云科技的公有云可用区域能满足大多要求;但当有低延迟、高度的本地数据处理、或者由于合法合规有数据驻留等需求时,可使用 Local Zones、Wavelength、Outposts、边缘计算或者 IoT、SnowFamily 来解决多元化网络需求。
2、高度可靠的云基础架构,助力可靠系统快速部署
在应用中,所有功能模块都有可能出现故障。虽然不能完全避免风险的发生,但风险程度整体可控。亚马逊云科技在大部分服务中采用蜂窝架构设计,把系统分割成多个蜂窝状单元,通过控制爆炸半径,降低故障发生时对整体系统的影响。随机分片思路则对蜂窝架构进行了进一步优化,把故障影响降到更低。
除了服务的设计思路以外,亚马逊云科技还通过各种运营模型和部署机制来保证云的弹性,如通过服务责任模型,明确定义云服务商和客户的责任区间,保障客户在任何阶段都能享有对所写代码和程序的控制权。
4、兼顾合规管理与服务优化,确保全球业务合规运行
亚马逊云科技几乎满足全球所有国家和地区的合规的要求,例如生物医疗、联邦认证以及金融如 HIPAA、FedRAMP 和 PCI 这样高标准的合规要求,最大限度确保客户的创新业务在全球范围内的安全与合规。
三、解锁生成式 AI 核心价值 践行生成式 AI 方法论
在过去的半年,“生成式 AI ”成为了一个重要的引爆点。云数据的大量扩散、高度可扩展计算能力的可用性以及机器学习的进步,让它登上了舞台。对此,亚马逊云科技全球产品副总裁 Matt Wood 博士,在峰会上围绕生成式 AI 为大家分享了亚马逊云科技的想法、服务、产品与理念,帮助大家解锁生成式 AI 的核心价值,践行生成式 AI 方法论。
Matt 博士指出:亚马逊深信不疑的是,生成式 AI 在重塑各行各业。当前,我们处在其发展的最早阶段,是“非连续变化”的新时代。与早期的互联网性质相似,生成式 AI 同样也会逐渐释放超越传统界限的创新,将我们带入一个前所未有的时代。
那么,如何抓住机遇、充分释放生成式 AI 的核心价值?Matt 博士对此提出了亚马逊云科技的应对策略:
- 利用一流的基础模型,构建出色的生成式 AI 应用程序;
- 安全私密的环境,便于使用私有数据定制化这些模型;
- 低成本、低延迟的技术,借助专门构建的机器学习基础设施;
- 借助专业代码生成工具,消除繁重工作并提高效率。