华为版ChatGPT预计7月初发布 名为“盘古Chat”

近日,据钛媒体APP从华为内部获悉,华为公司将发布一款直接对标ChatGPT的多模态千亿级大模型产品,名为“盘古Chat”。华为盘古Chat预计将于今年7月7日在华为云开发者大会 (HDC.Cloud2023) 上对外发布以及内测。据悉,该产品主要面向ToB/G政企端客户。

“盘古Chat”基于华为盘古大模型研发而成,盘古大模型于2020年11月在华为云内部立项成功。华为在训练盘古大模型时调用了超过 2000 块的昇腾 910 芯片,进行了超2个月的数据训练能力。华为内部称,每年大模型训练调用GPU / TPU卡超过 4000 片,3 年的大模型算力成本高达 9.6 亿元人民币。

根据华为公布的一份论文数据显示,华为盘古PanGu-Σ大模型参数最多为1.085万亿,基于华为自研的 MindSpore框架开发。整体来看,PanGu-Σ大模型在对话方面可能已接近 GPT-3.5的水平。

华为云官网显示,盘古大模型由 NLP 大模型、CV 大模型、多模态大模型、科学计算大模型等多个大模型构成,通过模型泛化,解决传统AI作坊式开发模式下不能解决的 AI 规模化、产业化难题,可以支持多种自然语言处理任务,包括文本生成、文本分类、问答系统等等。

详细来说,盘古NLP大模型首次使用Encoder-Decoder架构,兼顾NLP大模型的理解能力和生成能力,保证了模型在不同系统中的嵌入灵活性。下游应用中,仅需少量样本和可学习参数即可完成千亿规模大模型的快速微调和下游适配,这一模型在智能舆论以及智能营销方面都有不错的表现。

盘古CV大模型是首次实现模型按需抽取的业界最大CV大模型,首次实现兼顾判别与生成能力,基于模型大小和运行速度需求,自适应抽取不同规模模型,AI应用开发快速落地。使用层次化语义对齐和语义调整算法,在浅层特征上获得了更好的可分离性,使小样本学习的能力获得了显著提升,达到业界第一,这一模型在智能巡检以及智慧物流方面有不错的表现。

东吴证券在华为盘古大模型产业链研报中指出,华为盘古大模型的优势在于人才储备和算力自主可控,有望成为国内领先的大模型,其生态产业链标的有望迎来加速发展,包括拓维信息、四川长虹、麒麟软件(中国软件)、统信软件(诚迈科技)、麒麟信安等华为生态公司。

即将面世的盘古Chat,也让众多业内人士充满了期待!

服务商动态

Blink正式推出Blink Copilot 用类ChatGPT大语言模型构建网络安全

2023-6-5 9:44:28

服务商动态

科大讯飞将于6月9日发布“讯飞星火认知大模型”V1.5

2023-6-7 11:32:09

相关推荐