在第11天的直播中,谷歌DeepMind宣布推出推理测试模型Gemini 2.0 Flash Thinking。凭借卓越的速度与透明度,这款新模型能够高效应对复杂问题,与OpenAI的o1模型直接竞争。
Gemini 2.0 Flash Thinking以刚发布的2.0 Flash版本为基础,使用了类似o1模型的慢思维思考方式,可以深度可视化展示整个思维链过程,尤其是在执行数学、编程等复杂问题方面,能持续输出全部推理过程,而不是直接给出答案。
Gemini 2.0 Flash Thinking只支持32000个Token的输入内容(大约相当于50至60页的文本量),并且每个输出响应能够生成8000个Token。在谷歌AI Studio的介绍中,该公司强调新模型特别擅长“多模态理解、推理”以及“编码”任务。
Gemini 2.0 Flash Thinking可在谷歌的AI原型平台AI Studio中使用。模型卡将其描述为最适合多模态理解、推理和编码,能够推理编程、数学和物理等领域最复杂的问题。
与OpenAI的竞争对手推理模型o1和o1 mini相比,Gemini 2.0 Flash Thinking可通过下拉菜单向用户展示其逐步推理的过程,使得模型得出结论的方式更加清晰明了,透明度更高。
Gemini 2.0 Flash Thinking让用户能够窥见决策制定的全过程,从而破解了长久以来人们对人工智能如“黑箱”般运作的疑虑。尽管其许可条款尚未明确,但这一模型已足以与其他开源的竞争对手模型相媲美。
目前,Gemini 2.0 Flash Thinking已在Google AI Studio和Vertex AI平台上线。谷歌表示,这只是推理之旅的第一步,未来这些推理能力可能会集成到Gemini 2.0系列主要模型中。