阿里云“通义听悟”升级 发布多项AI新功能

3月19日,阿里云“通义听悟”发布多项新功能,同时上线音视频问答助手“小悟”,在业界首次实现单记录、跨记录、多语言自由问,支持对单个最长6小时、一次性上百条音视频内容的理解问答。同日,通义听悟还推出了“高校公益计划”,向所有中国大陆高校师生直接赠送价值数千元的500小时音视频转写时长。

通义听悟接入通义千问大模型,融合了十多项AI功能,包括转写、翻译、角色分离、全文摘要、章节速览、发言总结、PPT提取等,并支持标重点、记笔记。

此次,通义听悟升级上新了六大功能点。最重磅的是音视频问答助手“小悟”,关键信息直接“问”出来。小悟通过多语言Query处理、长篇章文本理解、指令演化框架优化及检索增强生成算法,在业内首次实现对超长音视频的单记录、跨记录、多语言自由问答,支持内容问答的音视频时长和文件数均突破业界上限。

用户不仅可在单一记录页呼唤小悟,对最高6小时、6G大小的音视频提问任何相关话题,或直接小悟要求整理金句、梳理结论、写会议纪要;更可在首页针对用户所有记录提问,支持一次性扫描理解上百条音视频内容;也可花式对英文视频用中文提问,小悟将直接给出中文回答,省去翻译。

针对用户需求,通义听悟还上线了一键AI改写、思维导图生成等新能力。例如,一键AI改写,将口语转为书面表达,尤其适合整理采访;思维导图自动生成,最多支持五级xmind脑图,适合播客摘要。而且,通义听悟还支持笔记插入视频时间戳及截图、自动识别音视频文件语种等细节体验升级。

针对学习科研场景对AI工具的强烈需求,通义听悟推出“高校公益计划”。所有中国大陆高校师生通过后缀edu.cn的教育邮箱认证后,均可直接免费获赠500小时音视频转写时长,存储空间从20G拓展至200G。通过语音识别技术将音视频快速转为文本,也是许多高校学生日常学习科研的刚需功能。

通义听悟产品负责人杨帆表示,2023年6月发布以来,通义听悟累计已有五百万用户,活跃用户日均转写音视频3次以上,平台每天处理字符数约20亿字。

服务商动态

华为云:鸿蒙和昇腾云深度协同 共同打造的AI创新生态

2024-3-18 16:40:56

服务商动态

天翼云荣获中国边缘云laaS市场第一

2024-3-21 15:04:26

相关推荐