7月14日,华为召开大模型时代华为AI存储新品发布会。在发布会上,华为推出OceanStor A310深度学习数据湖存储与FusionCube A3000训/推超融合一体机,为基础模型训练、行业模型训练,细分场景模型训练推理提供存储解决方案,释放AI新动能。
华为表示,企业在开发及实施大模型应用过程中,面临4大挑战。首先,数据准备时间长,数据来源分散,归集慢,预处理百TB数据需10天左右;其次,多模态大模型以海量文本、图片为训练集,当前海量小文件的加载速度不足100MB/s,训练集加载效率低。
第三,大模型参数频繁调优,训练平台不稳定,平均约2天出现一次训练中断,需要Checkpoint机制恢复训练,故障恢复耗时超过一天;第四,大模型实施门槛高,系统搭建繁杂,资源调度难,GPU资源利用率通常不到40%。
华为介绍称,OceanStor A310深度学习数据湖存储,面向基础/行业大模型数据湖场景,实现从数据归集、预处理到模型训练、推理应用的AI全流程海量数据管理。FusionCube A3000训/推超融合一体机,面向行业大模型训练/推理场景,针对百亿级模型应用,集成OceanStor A300高性能存储节点、训/推节点、交换设备、AI平台软件与管理运维软件,为大模型伙伴提供拎包入住式的部署体验,实现一站式交付。
华为数据存储产品线总裁周跃峰表示,大模型时代,数据决定AI智能的高度。作为数据的载体,数据存储成为AI大模型的关键基础设施。华为数据存储未来将持续创新,面向AI大模型时代提供多样化的方案与产品,携手合作伙伴共同推进AI赋能千行百业。