上周小编分享了关于申请讯飞星火认知大模型的内测流程。内测申请成功以后,大家接着最关注的就是讯飞星火认知大模型实际使用起来到底如何?根据5月初发布会现场公布的星火7大核心能力,小编对其进行了实测。以下是本次实测的详细内容。
1.文本生成
这次小编放弃了续写故事等比较常见的测试任务。首先让星火制定一份中学生研学游方案,星火的生成速度非常快,几乎是立刻就给出了反应。从方案内容来看,包括目的地选择、行程安排、费用预算等,整体也是比较完善的。
接着,又让星火撰写一篇新闻稿。语言精练、用词准确,但是篇幅过短。大家在输入问题的时候可以提出字数限制要求,更易得到自己想要的文本。
2.语言理解
小编提问了“大丈夫宁死不屈”和“大丈夫,能屈能伸”这两句话哪句是对的?
星火对这两句话分别进行了解释,最后阐释了这两句话的使用场景。可见,星火对于中国谚语的理解还是比较深厚的。
小编接着设定了“女朋友生气”的前提,然后询问星火应该坚持“大丈夫宁死不屈”还是“大丈夫,能屈能伸”。
星火的求生欲还是很强的,提示应该表达出对女朋友的重视和关心,让女朋友感受到诚意和真心。
3.知识问答
在知识问答方面,星火和其他国产语言大模型的能力不相上下。普通的百科问题几乎都可以顺利回答出来。小编特意询问了一些泛生活领域的问题。
例如,小孩子为什么要去上幼儿园?孩子应该和爸爸姓还是和妈妈姓?星火都给出了比较客观的答案,并且所列出的原因逻辑性也比较强。
4.逻辑推理
逻辑推理是很多大模型最容易“翻车”的领域,毕竟相对于人脑来说,各大模型的逻辑能力还是有一定差距的,这也可以理解。小编输入过河的逻辑推理问题,星火倒是给出了正确的答案。想要了解星火更多逻辑推理问答的话,大家可以多输入问题尝试。
5.数字能力
在5月初的星火发布会上,当时就提到了讯飞星火大模型的数学能力很强,能够达到ChatGPT的水平。现场测试中,星火顺利解出了一个计算三类花朵数量的题目。在实测过程中,小编输入了计算三角形面积的题目。星火列出了解题步骤,一目了然。
6.编程能力
在官方介绍中,星火认知大模型不仅可以生成代码,还可以修改、理解、编译代码,并且还具备Python、Java等多语言能力。在实测中,星火也针对问题给出了回答。根据很多程序员介绍,星火的编程能力还是非常不错的,偶尔会有漏洞出现。
7.多模态输入和表达能力
在多模态方面,讯飞星火大模型现在仅支持文字、语音两种输入方面。根据此前发布会的信息,讯飞的多模态输入和表达能力最迟将在今年8月份上线,提供给用户使用。
总的来说,讯飞星火认知大模型使用起来还是非常不错的,也具备了和头部大模型竞争的实力。其次,星火带来的惊喜还有在商业化方面的落地,通过学习机、智能办公本、汽车座舱交互系统、讯飞听见、数字员工等一系列产品,打通了“大模型+产品”的生态闭环。关于讯飞星火认知大模型的更多进展,让我们共同期待。
AI俱乐部,致力于打造最专业的AI交流社群。
星球将分享:
1、ChatGPT的使用方法,最新资讯,商业价。
2、邀请顶尖行业大佬,每周给大家发现一个商业落地案例。
3、组织星球小伙伴一起参与实战项目,亲身感受AI浪潮。
4、系列课程和训练营,手把手带着大家去实操ChatGPT。
5、一些副业思考、创业案例、落地案例分享。
6、最早期、专业的AI交流社群。探讨未来关于ChatGPT的机遇,帮助大家解决遇到的问题。
如果有小伙伴感兴趣的话,可以一起加入星球哦!