-
谷歌首推开源标准智能体交互协议A2A
近日,谷歌在Google Cloud Next 2025大会上宣布开源首个标准智能体交互协议——Agent2Agent Protocol(简称A2A),标志着智能体交互领域的一大突破。此前,Anthropic的模型上下文协议(MCP)为智能体提供了一种结构化的工具使用方式,而A2A则为智能体提供了一种相互协作的方式,将孤立的机器人转变为数字工作团队。此外,谷歌还开源了Agent开发套件ADK,内部…...- 0
- 29
-
Together AI联合Agentica开源最新模型DeepCoder
近日,著名大模型训练平台TogetherAI和智能体平台Agentica联合开源了新模型DeepCoder-14B-Preview,引起了广泛关注。该模型以仅有的140亿参数,在代码测试平台LiveCodeBench上的得分为60.6%,超过了OpenAI的o1模型(59.5%),仅略低于o3-mini(60.9%)。这一成绩在Codeforces和AIME2024的评测中也表现出色,与o1和o3…...- 0
- 22
-
Meta发布最新开源AI大模型Llama 4
近日,美国科技巨头Meta公司发布了其大型语言模型Llama的最新版本,Llama 4 Scout与Llama 4 Maverick。该模型是Meta迄今为止最先进的模型,也是同类产品中多模态性最强的模型。此外Meta还预览了其迄今最强大最智能的模型——Llama 4 Behemoth,是“新模型中的教师”。 Llama 4模型是Llama系列模型中首批采用混合专家(MoE)架构的模型,这一架构也…...- 0
- 14
-
OpenAI开源全新AI Agent评测基准PaperBench
近日,美国开放人工智能研究中心OpenAI宣布推出PaperBench。这是一个评估AI智能体复现前沿AI研究能力的基准,主要考核智能体的搜索、整合、执行等能力,需要对2024年国际机器学习大会上顶尖论文的复现,包括对论文内容的理解、代码编写以及实验执行等方面的能力。 据悉,在PaperBench上测试多个前沿模型后发现,表现最佳的智能体Claude 3.5 Sonnet(新版)结合开源框架,平均…...- 0
- 22
-
OpenAI即将发布开放权重语言模型
近日,OpenAI CEO Sam Altman正式宣布,将在未来几个月内推出一款具备推理能力的强大开放权重语言模型力。这次OpenAI选择回归开源初心——这是自2019年GPT-2之后,OpenAI首次开源语言模型。 Sam Altman表示,虽然这一想法已酝酿许久,但此前其他优先事项占据了主导地位。如今,发布这款模型的时机变得尤为重要。 即将发布的新模型具有两大特点:开放权重和强化推理能力。 …...- 0
- 16
-
微软与清华联合发布SECOM
近期,微软和清华的研究人员联合发布了一种专用于个性对话Agent的记忆构建和检索的创新方法,SECOM。 研究人员在LOCOMO和Long-MT-Bench+两个超复杂数据集上进行了综合评估,结果显示,在LOCOMO数据集上,SECOM的GPT4-Score达71.57,比全历史方法(54.15)高17.42分,比轮次级方法(65.55)高6.02分。而在Long-MT-Bench+中,其88.8…...- 0
- 14
-
OpenAI发布Agent SDK重大更新
最近,OpenAI对Agent SDK进行了重大更新支持MCP服务,可以统一接口标准解锁无限工具。现在Agent SDK可以快速集成网络搜索、专业分析、本地查询、网络追踪等各式各样的工具,这对于开发超复杂自动化智能体来说帮助巨大。例如,在开发一个需要同时进行文件处理、数据查询和网络信息收集的智能体时,开发者可以通过MCP服务器分别集成文件系统工具、数据库查询工具和网络爬虫工具,更高效地完成复杂任务…...- 0
- 30
-
谷歌推出最强推理模型Gemini 2.5 Pro
近日,Google发布了他们迄今为止性能最强的Gemini模型——Gemini 2.5 Pro实验版。据介绍,实验版Gemini 2.5 Pro是谷歌旗下最先进的复杂任务模型,展示了强大的推理和代码能力,并拥有Gemini系列此前各模型所具有的全部功能。 根据测试数据显示,Gemini 2.5 Pro在AIME 2025、MMMU、GPQA、LiveCodeBench v5、等主流测试平台中超过了…...- 0
- 8
-
OpenAI推出最新文生图模型
近日,OpenAI对GPT-4o和Sora进行了重大更新,推出了全新的文生图模型。该模型不仅能够生成图像,还支持自定义操作、连续发问、风格转换以及制作图像PPT等多种实用功能。 它生成的图像非常逼真,肉眼几乎看不出任何破绽,在精细度、细节和文本遵循方面非常出色,可以媲美甚至在某些功能超过该领域的头部平台Midjourney。 OpenAI联合创始人兼首席执行官表示,新的文生图模型是一项令人难以置信…...- 0
- 13
-
DeepSeek开源新版V3模型
最近,DeepSeek开源了V3模型的最新版本0324。目前V3-0324开源版本目前已经上架开源网站huggingface,模型体积为6850亿参数。深度求索微信官方公众号表示,此次更新属于小版本升级,目前已经在官方网页、App小程序等入口开放。 初代V3模型最为人所熟知的,可能还是“557.6万美金比肩Claude 3.5效果”的超级性价比。而更新后的模型由其新的32KGPU集群上改进的后训练…...- 0
- 22
-
阿里巴巴开源多语言大模型Babel
近期,阿里巴巴开源了多语言大模型Babel,旨在弥合语言鸿沟,让AI能够理解并使用全球九成以上人口的语言进行交流。该模型支持豪萨语、波斯语、印地语、西班牙语、阿拉伯语、孟加拉语、葡萄牙语、乌尔都语、印尼语、斯瓦希里语等25种主流语言,覆盖全球90%以上的人口。 与传统的持续预训练方法不同,Babel采用了独特的层扩展技术来提升模型的能力。这种方法可以理解为在模型原有的基础上,以一种更精巧的方式增加…...- 0
- 20
-
OpenAI推出一系列全新语音模型
近日,美国开放人工智能研究中心OpenAI发布了3款全新语音模型,gpt-4o-transcribe、gpt-4o-mini-transcribe和gpt-4o-mini-tts,致力于打造可靠、精准、灵活的语音智能体。同时,升级Agent SDK,支持语音能力、流式处理优化,助力开发者快速构建语音智能体。新模型基于真实音频数据集预训练,性能卓越且价格亲民。 1、两款全新语音转文本模型:GPT-4…...- 0
- 18