谷歌重磅推出Gemini Live 硬刚GPT-4o

近日谷歌在Pixel 9系列手机发布会上推出了智能语音助手-Gemini Live。Gemini Live支持自然语言提问、能识别图像、视频和语音,是一个多模态智能助手。Gemini Live智能语音助手硬刚GPT-4o,将于近日开始率先面向使用英语的Gemini Advanced订阅用户开放。

Gemini Live

Gemini Live的主要特点:

1、推动自然、流畅的对话交流

Gemini Live提供了一种移动对话体验,让用户和Gemini展开自由流畅的对话。如用户可以在聊天机器人说话时打断它,提出后续问题,聊天机器人会实时适应用户的说话模式。

用户也可以授权Gemini Live访问邮箱、地图和通讯录,只需对其说出打电话、发信息等指令,就能帮助用户自动完成。

2、不支持多模态输入

Gemini Live还不具备谷歌在I/O大会上展示的功能之一:多模态输入。

虽然OpenAI的GPT-4o语音模式要早于Gemini Live,但至今仍处于小范围测试。谷歌一举发布智能语音助手Gemini Live,抢占了安卓手机的市场。很多用户表示,这一次谷歌确实快OpenAI一步抢占了先机。

谷歌表示Gemini Live已经与其邮件、云盘、相册、天气等原生应用进行了集成,未来会扩展至Keep、Tasks、Utilities等知名应用,可以帮助人们自动完成更多的日常任务。

现阶段安卓手机Gemini Advanced英文版订阅用户已经可以使用Gemini Live,提供了10种语音选择和45种语言。预计在不久的将来,谷歌还将扩展至iOS系统和更多语言。

行业动态

全新AI程序员Genie发布 秒杀Devin和GPT-4

2024-8-13 10:18:01

行业动态

英伟达开源了最新Minitron系列大模型

2024-8-16 10:42:29

相关推荐