2023年11月,阿里云在2023云栖大会正式上线通义听悟-工作学习AI助手。
在多媒体时代,人们每天记录、分享和观看大量的音频视频内容,通义听悟通过前沿的语音AI技术,能够准确地将音频视频内容转写为易读的文字。不仅如此,结合通义千问大语言模型的强大理解能力,通过全文摘要、章节速览、发言总结等功能,使用户能够从不同角度“一目十行”地更高效“阅读”音视频内容。随着大模型能力的飞速进步,通义听悟能为用户提供更多先进的能力,帮助用户梳理和挖掘出音视频内容中的信息价值,并将所有的记录和收集都沉淀为知识资产,随时供用户回顾和利用。借助通义听悟,用户可以如实地记录一堂精彩的讲座、一次深度访谈或一场重要会议,它将成为用户身边的智能伙伴,“听”遍所有内容,“悟”得其中深意。
通义听悟以阿里云通义千问大模型为基座,融合了音视频AI技术的功能和优势,拥有领悟理解和融会贯通的能力,全面提升知识从音视频向图文形态转化的效率,包括实时语音识别、音视频语音识别、发言人角色区分、内容规整、章节速览、一键笔记、全文总结、提取PPT等能力,可广泛应用于会议交流、教学培训、调研访谈、音视频理解与问答等领域。
“通义听悟”不仅融合了十多项AI功能,可以全面提升知识从音视频向图文形态转化的效率,还能高准确度区分不同发言人、生成会议记录,仅需一秒钟即可为音视频划分章节并形成摘要、总结全文及每个发言人的观点、整理关注重点和待办事项。通义听悟的“提取PPT”功能引入视觉AI算法,自动将PPT讲解视频分割为演示文稿,并对每页PPT进行要点总结,形成一份图文并茂的大纲,解决培训、网课学习等场景“求PPT难”的问题。
大受欢迎的通义听悟,背后依托的是阿里云强大的智能计算能力。创立于2009年的阿里云,是全球先进的云计算及人工智能科技公司,为200多个国家和地区的企业、开发者和政府机构提供服务。阿里云致力于让计算成为公共服务,通过提供安全、可靠的计算和数据处理能力,让云计算和人工智能成为普惠科技。
面向AI时代,阿里云以云计算为基础,以模型为中心,以从底层算力到AI平台再到模型服务全栈技术创新,让云计算加速AI浪潮下的产业智能升级。