阿里云发布通义千问2.5 全面赶超GPT-4

最近,阿里云召开峰会,正式发布通义千问2.5,模型性能全面赶超GPT-4-Turbo,成为“地表最强”中文大模型。同时,通义千问1100亿参数开源模型在多个基准测评收获最佳成绩,超越Llama-3-70B,成为开源领域最强大模型。

相比此前的通义千问2.1版,2.5版模型的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%,中文能力更是持续领先业界。

一年间,通义发展出了业界领先的文生图、智能编码、文档解析、音视频理解等能力,企业客户和开发者可以通过API调用、模型下载等方式接入通义,个人用户可从APP、官网和小程序免费使用通义。同时原通义千问APP于今天正式宣布更名为“通义APP”,将通义大模型全套能力集于一身,致力于成为“通情达义”的AI助手。

通义是大模型开源最积极的推动者和实践者。去年8月,通义宣布加入开源行列,随之启动马不停蹄的开源狂飙,沿着“全模态、全尺寸”开源的路线,陆续推出十多款开源模型。目前,通义开源模型下载量已经超过700万。

大模型的训练和迭代成本极高,绝大部分的AI开发者和中小企业都无法负担。阿里云始终坚持推动大模型开源,让开发者们不必从头训练模型,还把模型选型的主动权交给了开发者,大大加速了大模型的应用落地进程。

为顺应不同场景用户的需求,通义推出参数规模横跨5亿到1100亿的八款大语言模型,小尺寸模型如0.5B、1.8B、4B、7B、14B,可便捷地在手机、PC等端侧设备部署;大尺寸模型如72B、110B能支持企业级和科研级的应用;中等尺寸如32B试图在性能、效率和内存占用之间找到最具性价比的平衡点。此外,通义还开源了视觉理解模型Qwen-VL、音频理解模型Qwen-Audio、代码模型CodeQwen1.5-7B、混合专家模型Qwen1.5-MoE。

通义72B、110B开源模型都曾登顶Open LLM Leaderboard榜首。在开放研究机构LMSYS Org推出的基准测试平台Chatbot Arena上,通义72B模型多次进入“盲测”结果全球Top 10,创造了国产大模型的先例。长期沉淀的良好口碑为通义开源模型赢得一众铁粉,每有开源动作都会早早被开发者“蹲守”,也总能获得生态伙伴第一时间支持。

百炼平台也已从模型开发、应用开发到算力底座实现2.0全面升级,更加易用、更加开放,引入更多模型,还率先兼容LlamaIndex等开源框架,企业可自由替换能力组件来适配自身系统。针对当下企业最关注的RAG链路,百炼提供灵活开放的企业级检索增强服务,5到10行代码即可搭建RAG应用,让大模型拥有“最强外挂”。

2023年10月,阿里云发布了百炼大模型平台,开发者可通过“拖拉拽”5分钟开发一款大模型应用,几小时“炼”出一个专属模型,把精力专注于应用创新。本次大会上,百炼升级成为阿里云承载云+AI能力的重要平台,提供一站式、全托管的大模型定制与应用服务。升级后,百炼可以更好支持地大型企业和成熟开发者的需求。

同时,通义灵码宣布推出企业版,满足企业用户的定制化需求,帮助企业提升研发效率。通义灵码是国内用户规模第一的智能编码助手,基于SOTA水准的通义千问代码模型CodeQwen1.5研发,插件下载量已超350万,每日推荐代码超3000万次,被开发者采纳的代码超亿行,是国内最受欢迎的智能编程助手。目前,通义灵码编码助手也已“入职”了多家金融、汽车、新零售、互联网等企业。

通义灵码熟练掌握Java、Python、Go、JavaScript、TypeScript、C/C++、C#等200多种编程语言,可以辅助写代码、读代码、查Bug、优化代码等。其底层模型是通义千问团队开发的CodeQwen1.5,具备优秀的代码生成能力、长序列建模能力、代码修改能力和SQL能力,4月份刚刚登顶Big Code模型排行榜。

为满足企业客户在私域知识检索、企业数据合规、统一管理等方面的需求,通义灵码推出标准版、专属版两个企业版。标准版“开箱即用”,可以接入企业私域知识,实现私域知识问答,让AI推荐的代码更贴合企业规范;专属版在标准服务之外,提供公共云上专属实例部署、企业私有模型训练、独立企业账号系统等服务,满足大中型企业客户定制模型、节约算力的需求。

通义正在成为最受中国企业欢迎的大模型。根据最新数据,通义通过阿里云服务企业超过9万、通过钉钉服务企业超过220万,现已落地PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域。

行业动态

谷歌发布AlphaFold 3 开启药物发现新时代

2024-5-9 14:02:25

行业动态

英伟达开源对齐框架NeMo-Aligner

2024-5-13 11:16:36

相关推荐