2023年4月13日,在“2023知乎发现大会”上,知乎创始人、董事长兼CEO周源和知乎合伙人、CTO李大海共同宣布了知乎在AI大模型上的最新合作与应用,正式发布“知海图AI”中文大模型。
“知海图AI”是知乎通过联合研发与战略投资的方式与国内顶尖大模型团队面壁智能达成深度合作、共同开发的中文大模型产品。
目前,“知海图AI”中文大模型已经在知乎热榜得到运用。知乎首个大模型功能“热榜摘要”上线并开启内测,利用超强的语言理解能力对知乎热榜上的问题回答进行抓取、整理和聚合,并把回答梗概展现给用户,给予直观清晰的回答。
知乎拥有天然的大模型优势,有场景有应用,最关键的还有天然大规模、高质量的中文数据池。NewBing也将其视作中文数据源之一,一时间股价暴涨近50%。而且,在众多尤其科研工作者认知中,知乎作为知识问答分享平台,每一次技术革命爆发都在这里围观与见证。所以,知乎大模型“知海图AI”上线也是情理之中,意料之外的事。
为什么走这样一条路?
首份《中国AIGC产业全景报告》显示,国内大模型发展大致可以分为三种路径:基础设施层、模型层以及应用层。其中,模型层成为当前发展的关键卡口,在一定程度上限制了上下层级(基础设施层、应用层)的发展。
至于模型层发展好与不好,归根结底,主要来自算力和数据这两方面:算力是支撑背后大语言模型训练的硬件基础,而数据则是直接影响模型能力强弱甚至生成质量的关键。尤其是中文数据这块,一方面本质原因,中文相对英文复杂,技术难度高;另一方面,国外英文数据集更丰富,且质量较高。但国内的中文语料并不完善,必要时还需要各家公司来清洗,耗费人力财力。而这恰好与知乎区别于其他平台的独特优势有关。
我们都知道,模型效果的好坏,既取决于数据的数量,也取决于质量。这一点知乎似乎能做到两者兼备。
未来,“知海图AI”的能力将逐步应用在对创作、讨论场和信息获取的赋能上。周源表示,知乎以应用层和数据层的独特优势,将致力于发展中文互联网的大语言模型。