近日,面壁智能联合来自清华、人大、腾讯的研究人员共同发布了中文领域首个基于交互式网页搜索的问答开源模型框架 WebCPM,相关工作录用于自然语言处理顶级会议 ACL 2023。WebCPM的亮点简单来说就是支持交互式网络搜索,能够像人类一样与搜索引擎交互从而收集回答问题所需要的事实性知识并生成答案。
WebCPM 论文链接:https://arxiv.org/abs/2305.06849
WebCPM 数据与代码链接:https://github.com/thunlp/WebCPM
在WebCPM没有出现之前,长文本开放问答(LFQA)模型是用户搜索复杂、开放式问题的主要使用工具。传统的 LFQA 范式存在一个缺陷:它通常依赖于非交互式的检索方法,即仅使用原始问题作为查询语句来检索信息。而类似WebCPM这样的交互式网页搜索模型不仅提供了获取多样化信息来源的途径,同时也反映了人类解决问题的认知过程,从而提高了可解释性。
WebCPM模型框架包括搜索模型和答案综合模型两个。
搜索模型模仿人类网页搜索行为、与搜索引擎交互并进行信息检索。作者将网页搜索任务划分为 3 个子任务:搜索行为预测、查询语句生成、支持事实摘要。搜索行为预测模块在每一步决定执行哪个具体的搜索行为。该模块可以调用其它两个模块来生成下一步查询语句或摘录重要信息。每个子任务都基于生成式中文大模型来训练。过组合 3 个训练得到的模块,该模型能够在搜索引擎界面上执行一系列操作以收集与问题相关的信息。
答案综合模型根据原问题与收集到的事实生成连贯的答案。然而与人类不同,经过训练的搜索模型偶尔会收集到不相关的噪声,这将影响生成答案的质量。为了解决这一问题,作者在答案综合模型的训练数据中引入噪声,使其具备一定的去噪的能力,从而忽略不相关的事实,只关注重要的事实以生成答案。
WebCPM的开发公司面壁智能是一家人工智能大模型技术创新与应用落地赋能公司。CPM 大模型是面壁团队根据多年的大模型训练经验自研的预训练语言大模型。WebCPM将促进国产大模型领域的前沿研究、应用研发和产业发展。
AI俱乐部,致力于打造最专业的AI交流社群。
星球将分享:
1、ChatGPT的使用方法,最新资讯,商业价。
2、邀请顶尖行业大佬,每周给大家发现一个商业落地案例。
3、组织星球小伙伴一起参与实战项目,亲身感受AI浪潮。
4、系列课程和训练营,手把手带着大家去实操ChatGPT。
5、一些副业思考、创业案例、落地案例分享。
6、最早期、专业的AI交流社群。探讨未来关于ChatGPT的机遇,帮助大家解决遇到的问题。
如果有小伙伴感兴趣的话,可以一起加入星球哦!