4月10日,在商汤技术交流日上,商汤科技董事长兼首席执行官徐立宣布推出商汤日日新大模型,基于该体系的AI内容创作社区平台“商汤秒画SenseMirage”也一并亮相。
“自研+开源”共筑秒画差异化优势
相比于市面上大多数主打文生图功能的AIGC产品,商汤秒画基于“自研+开源”的模式,致力于打造一个集模型、训练、推理和交流于一体的社区。
用户能够选择使用商汤的模型、自训练的模型或开源模型。同时,秒画将为用户提供模型特异性加速服务,通过秒画平台的模型编译技术,自动分析用户上传的模型结构参数,把它和底层的GPU加速算子进行模型编译,缩短模型的生成速度。实测在本地RTX3070显卡需要10秒生成的图片通过秒画加速技术只需要2秒的推理时间就可以生成。
大模型+大算力超前布局
大模型要足够好有三个核心要素,首先是模型参数量要够大能保证泛化上限足够高;二是在同等参数量下,网络结构设计要足够高效;第三,大模型的训练稳定性需要被保障。商汤已经在大模型方面有了很深厚的技术积累,也正式因为如此,秒画能够在很长的周期内,保持平稳的训练状态,从而保证模型训练的效率。
在算力层面方面,商汤从2018年就开始攻克算力难题,打造了SenseCore商汤AI大装置的“原型机”。2020年,商汤斥资56亿元,在上海建设AIDC人工智能计算中心。2022年,AIDC正式开始运营。如今,商汤SenseCore AI大装置持续扩建,完成了2.7万块才能够GPU的部署并实现了5.0 exaFLOPS的算力输出能力,以AI-as-a Service(AIaaS)的模式面向行业伙伴提供服务。目前最多可支持20个千亿参数量大模型(以千卡并行)同时训练,最高可支持万亿参数超大模型的训练。
瞄准B端用户
在去年,商汤的AIGC产品就已经吸引了非常多的B端用户。而秒画对于B端用户来说,是一个更加“友好”的AIGC平台。秒画的核心目的就是为了降低AIGC和大模型的微调训练门槛,让技术能够在不具有这么多GPU或者甚至不具有这类专业知识的中小B端的厂商、用户里产生价值。
对于秒画而言,通过“大模型+大算力”提供解决方案,能够吸引更多下游用户投入模型迭代,也有助于商汤进一步积累相关数据,提升产品迭代速率与产品体验,进而加速商业化布局,反哺公司业绩。