-
微软与清华联合发布SECOM
近期,微软和清华的研究人员联合发布了一种专用于个性对话Agent的记忆构建和检索的创新方法,SECOM。 研究人员在LOCOMO和Long-MT-Bench+两个超复杂数据集上进行了综合评估,结果显示,在LOCOMO数据集上,SECOM的GPT4-Score达71.57,比全历史方法(54.15)高17.42分,比轮次级方法(65.55)高6.02分。而在Long-MT-Bench+中,其88.8…...- 0
- 2
-
OpenAI发布Agent SDK重大更新
最近,OpenAI对Agent SDK进行了重大更新支持MCP服务,可以统一接口标准解锁无限工具。现在Agent SDK可以快速集成网络搜索、专业分析、本地查询、网络追踪等各式各样的工具,这对于开发超复杂自动化智能体来说帮助巨大。例如,在开发一个需要同时进行文件处理、数据查询和网络信息收集的智能体时,开发者可以通过MCP服务器分别集成文件系统工具、数据库查询工具和网络爬虫工具,更高效地完成复杂任务…...- 0
- 4
-
谷歌推出最强推理模型Gemini 2.5 Pro
近日,Google发布了他们迄今为止性能最强的Gemini模型——Gemini 2.5 Pro实验版。据介绍,实验版Gemini 2.5 Pro是谷歌旗下最先进的复杂任务模型,展示了强大的推理和代码能力,并拥有Gemini系列此前各模型所具有的全部功能。 根据测试数据显示,Gemini 2.5 Pro在AIME 2025、MMMU、GPQA、LiveCodeBench v5、等主流测试平台中超过了…...- 0
- 4
-
OpenAI推出最新文生图模型
近日,OpenAI对GPT-4o和Sora进行了重大更新,推出了全新的文生图模型。该模型不仅能够生成图像,还支持自定义操作、连续发问、风格转换以及制作图像PPT等多种实用功能。 它生成的图像非常逼真,肉眼几乎看不出任何破绽,在精细度、细节和文本遵循方面非常出色,可以媲美甚至在某些功能超过该领域的头部平台Midjourney。 OpenAI联合创始人兼首席执行官表示,新的文生图模型是一项令人难以置信…...- 0
- 8
-
DeepSeek开源新版V3模型
最近,DeepSeek开源了V3模型的最新版本0324。目前V3-0324开源版本目前已经上架开源网站huggingface,模型体积为6850亿参数。深度求索微信官方公众号表示,此次更新属于小版本升级,目前已经在官方网页、App小程序等入口开放。 初代V3模型最为人所熟知的,可能还是“557.6万美金比肩Claude 3.5效果”的超级性价比。而更新后的模型由其新的32KGPU集群上改进的后训练…...- 0
- 17
-
阿里巴巴开源多语言大模型Babel
近期,阿里巴巴开源了多语言大模型Babel,旨在弥合语言鸿沟,让AI能够理解并使用全球九成以上人口的语言进行交流。该模型支持豪萨语、波斯语、印地语、西班牙语、阿拉伯语、孟加拉语、葡萄牙语、乌尔都语、印尼语、斯瓦希里语等25种主流语言,覆盖全球90%以上的人口。 与传统的持续预训练方法不同,Babel采用了独特的层扩展技术来提升模型的能力。这种方法可以理解为在模型原有的基础上,以一种更精巧的方式增加…...- 0
- 12
-
OpenAI推出一系列全新语音模型
近日,美国开放人工智能研究中心OpenAI发布了3款全新语音模型,gpt-4o-transcribe、gpt-4o-mini-transcribe和gpt-4o-mini-tts,致力于打造可靠、精准、灵活的语音智能体。同时,升级Agent SDK,支持语音能力、流式处理优化,助力开发者快速构建语音智能体。新模型基于真实音频数据集预训练,性能卓越且价格亲民。 1、两款全新语音转文本模型:GPT-4…...- 0
- 15
-
Predibase发布全球首个端到端强化微调平台RFT
最近,Predibase发布全球首个端到端强化微调平台RFT并开源,支持无服务器和端到端训练方法。与传统的监督式微调相比,RFT不依赖大量的标注数据,而是通过奖励和自定义函数来完成持续的强化学习,同时支持无服务器和端到端训练方法,从数据管理、训练模型到应用部署可以在同一个平台全部完成。 简而言之,用户只需要一个浏览器,设定微调目标、上传数据、就能完成以前非常复杂的大模型微调流程。 为了展示RFT的…...- 0
- 11
-
AMD推出完全开源的小参数模型Instella-3B
近日,AMD在官网开源了最新小参数模型Instella-3B。该模型是在AMD Instinct MI300X GPU上训练的,是完全开源的。根据AMD公布的数据,其性能与Llama 3.2 3B、Gemma-2 2B和Qwen 2.5 3B等同类产品相比具有很强的竞争力。 Instella-3B-SFT是经过监督微调的模型,使用了89.02亿tokens的数据,增强了遵循指令的能力。 Inste…...- 0
- 12
-
Zoom发布一系列AI Agent
全球视频会议领导者Zoom在官网宣布,发布一系列AI Agent产品来增强全平台功能。其中最重要的是Zoom的类ChatGPT助手AI Companion,具备记忆、推理、任务执行和协调四大功能。这将帮助用户从重复、繁琐的工作中解脱出来,节省大量时间提升效率。 AI Companion获得Agent增强后拥有了记忆、推理、任务执行和协调四大功能,也是帮助其他功能自动执行重复、复杂数字化业务的基石。…...- 0
- 13
-
阿里云联手Manus共同开发本土化智能体
近日,阿里云宣布与AI初创公司Manus达成战略合作,双方将基于阿里通义最新推出的开源模型,共同开发通用智能体。这一举动不仅引发了业内的广泛关注,也体现了国内AI产业从单一竞争转向生态合作的趋势。 此次合作的核心在于推动Manus的AI能力全面适配国产模型及算力生态。据透露,双方将依托通义千问系列开源大模型,重构Manus的底层架构,确保其原有功能在国产硬件平台上实现“零损耗”运行,涵盖智能体开发…...- 0
- 10
-
谷歌宣布开源最新模型Gemma-3 号称能媲美DeepSeek
随着DeepSeek的爆火,国内外的人工智能研究机构都压力倍增。近日,谷歌宣布开源最新多模态大模型Gemma-3,主打低成本高性能。Gemma-3共有10亿、40亿、120亿和270亿四种参数。但即便最大的270亿参数,只需要一张H100就能高效推理,同类模型要达到这个效果最少要提升10倍算力,也是目前最强小参数模型。 谷歌表示,Gemma-3是一系列轻量级、最先进的开源模型,其构建基于与Gemi…...- 0
- 34