随着ChatGPT的横空出世,2023年成为全球公认的大模型元年。自2022年底开始,国内外的AI大模型就层出不穷,单从国内来说,据不完全数据统计,已经有80多种,并且还在持续增加。从研发公司来看,除了百度、阿里、腾讯三大头部互联网厂商率先公布大模型以外,很多新兴的人工智能公司也崭露头角,例如百川智能、智源人工智能研究院,此外,很多高校和研究机构也加入战场,清华大学、北京大学、中科院都先后推出了大模型,引发热烈讨论。而今天我们所要说的悟道,也是一个在国内非常受关注的大模型。
悟道大模型是什么?悟道大模型由智源研究院研发,是中国首个,同时也是世界最大的人工智能大语言模型,旨在在人类层面的思维上超越Open AI的GPT-3和谷歌的LaMDA。悟道大模型的起步时间很早,在2021年的时候,智源研究院就先后推出了悟道1.0和悟道2.0,比ChatGPT公布的时间还要早一年多。2023年6月,悟道3.0进入全面开源新阶段,悟道3.0包括悟道・天鹰(Aquila)语言大模型系列、“天秤(FlagEval)”大语言评测体系及开放平台以及悟道・视界视觉大模型系列。经过4.9TB的图像和文本训练,并在9个基准上超过了最先进(SOTA)水平,悟道大模型逐渐接近于实现人工智能(AGI)和人类水平的思维。
具体来看,悟道·天鹰语言大模型是首个具备中英双语知识,支持商用许可协议、国内数据合规需求的开源语言大模型。这一模型在中英文高质量语料基础上从“0”开始训练,通过数据质量的控制、多种训练的优化方法,实现在更小的数据集、更短的训练时间获得更优的性能。
天秤大模型评测体系及开放平台,旨在建立科学、公正、开放的评测基准、方法、工具集,协助研究人员全方位评估基础模型及训练算法的性能,同时探索利用AI方法实现对主观评测的辅助,大幅提升评测的效率和客观性。
悟道·视界视觉大模型则系统化解决了当前计算机视觉领域的一系列瓶颈问题,包括任务统一、模型规模化以及数据效率等。
悟道3.0的全面开源,意味着全球开发者和研究者都可以无门槛地获取和使用这款高效的AI模型,开发者们可以利用悟道3.0进行各种开发和优化,进一步提升其性能和适用性。悟道3.0将助力更多的应用和创新诞生,推动人工智能技术的全面普及和深入应用。