全部标签

行业动态

行业动态

微软与清华联合发布SECOM

近期，微软和清华的研究人员联合发布了一种专用于个性对话Agent的记忆构建和检索的创新方法，SECOM。研究人员在LOCOMO和Long-MT-Bench+两个超复杂数据集上进行了综合评估，结果显示，在LOCOMO数据集上，SECOM的GPT4-Score达71.57，比全历史方法（54.15）高17.42分，比轮次级方法（65.55）高6.02分。而在Long-MT-Bench+中，其88.8…...
- 46分钟前
- 0
- 2
行业动态

OpenAI发布Agent SDK重大更新

最近，OpenAI对Agent SDK进行了重大更新支持MCP服务，可以统一接口标准解锁无限工具。现在Agent SDK可以快速集成网络搜索、专业分析、本地查询、网络追踪等各式各样的工具，这对于开发超复杂自动化智能体来说帮助巨大。例如，在开发一个需要同时进行文件处理、数据查询和网络信息收集的智能体时，开发者可以通过MCP服务器分别集成文件系统工具、数据库查询工具和网络爬虫工具，更高效地完成复杂任务…...
- 2025年3月28日
- 0
- 4
行业动态

谷歌推出最强推理模型Gemini 2.5 Pro

近日，Google发布了他们迄今为止性能最强的Gemini模型——Gemini 2.5 Pro实验版。据介绍，实验版Gemini 2.5 Pro是谷歌旗下最先进的复杂任务模型，展示了强大的推理和代码能力，并拥有Gemini系列此前各模型所具有的全部功能。根据测试数据显示，Gemini 2.5 Pro在AIME 2025、MMMU、GPQA、LiveCodeBench v5、等主流测试平台中超过了…...
- 2025年3月27日
- 0
- 4
行业动态

OpenAI推出最新文生图模型

近日，OpenAI对GPT-4o和Sora进行了重大更新，推出了全新的文生图模型。该模型不仅能够生成图像，还支持自定义操作、连续发问、风格转换以及制作图像PPT等多种实用功能。它生成的图像非常逼真，肉眼几乎看不出任何破绽，在精细度、细节和文本遵循方面非常出色，可以媲美甚至在某些功能超过该领域的头部平台Midjourney。 OpenAI联合创始人兼首席执行官表示，新的文生图模型是一项令人难以置信…...
- 2025年3月26日
- 0
- 8
行业动态

DeepSeek开源新版V3模型

最近，DeepSeek开源了V3模型的最新版本0324。目前V3-0324开源版本目前已经上架开源网站huggingface，模型体积为6850亿参数。深度求索微信官方公众号表示，此次更新属于小版本升级，目前已经在官方网页、App小程序等入口开放。初代V3模型最为人所熟知的，可能还是“557.6万美金比肩Claude 3.5效果”的超级性价比。而更新后的模型由其新的32KGPU集群上改进的后训练…...
- 2025年3月25日
- 0
- 17
行业动态

阿里巴巴开源多语言大模型Babel

近期，阿里巴巴开源了多语言大模型Babel，旨在弥合语言鸿沟，让AI能够理解并使用全球九成以上人口的语言进行交流。该模型支持豪萨语、波斯语、印地语、西班牙语、阿拉伯语、孟加拉语、葡萄牙语、乌尔都语、印尼语、斯瓦希里语等25种主流语言，覆盖全球90%以上的人口。与传统的持续预训练方法不同，Babel采用了独特的层扩展技术来提升模型的能力。这种方法可以理解为在模型原有的基础上，以一种更精巧的方式增加…...
- 2025年3月24日
- 0
- 12
行业动态

OpenAI推出一系列全新语音模型

近日，美国开放人工智能研究中心OpenAI发布了3款全新语音模型，gpt-4o-transcribe、gpt-4o-mini-transcribe和gpt-4o-mini-tts，致力于打造可靠、精准、灵活的语音智能体。同时，升级Agent SDK，支持语音能力、流式处理优化，助力开发者快速构建语音智能体。新模型基于真实音频数据集预训练，性能卓越且价格亲民。 1、两款全新语音转文本模型：GPT-4…...
- 2025年3月21日
- 0
- 15
行业动态

Predibase发布全球首个端到端强化微调平台RFT

最近，Predibase发布全球首个端到端强化微调平台RFT并开源，支持无服务器和端到端训练方法。与传统的监督式微调相比，RFT不依赖大量的标注数据，而是通过奖励和自定义函数来完成持续的强化学习，同时支持无服务器和端到端训练方法，从数据管理、训练模型到应用部署可以在同一个平台全部完成。简而言之，用户只需要一个浏览器，设定微调目标、上传数据、就能完成以前非常复杂的大模型微调流程。为了展示RFT的…...
- 2025年3月20日
- 0
- 11
行业动态

AMD推出完全开源的小参数模型Instella-3B

近日，AMD在官网开源了最新小参数模型Instella-3B。该模型是在AMD Instinct MI300X GPU上训练的，是完全开源的。根据AMD公布的数据，其性能与Llama 3.2 3B、Gemma-2 2B和Qwen 2.5 3B等同类产品相比具有很强的竞争力。 Instella-3B-SFT是经过监督微调的模型，使用了89.02亿tokens的数据，增强了遵循指令的能力。 Inste…...
- 2025年3月19日
- 0
- 12
行业动态

Zoom发布一系列AI Agent

全球视频会议领导者Zoom在官网宣布，发布一系列AI Agent产品来增强全平台功能。其中最重要的是Zoom的类ChatGPT助手AI Companion，具备记忆、推理、任务执行和协调四大功能。这将帮助用户从重复、繁琐的工作中解脱出来，节省大量时间提升效率。 AI Companion获得Agent增强后拥有了记忆、推理、任务执行和协调四大功能，也是帮助其他功能自动执行重复、复杂数字化业务的基石。…...
- 2025年3月18日
- 0
- 13
行业动态

阿里云联手Manus共同开发本土化智能体

近日，阿里云宣布与AI初创公司Manus达成战略合作，双方将基于阿里通义最新推出的开源模型，共同开发通用智能体。这一举动不仅引发了业内的广泛关注，也体现了国内AI产业从单一竞争转向生态合作的趋势。此次合作的核心在于推动Manus的AI能力全面适配国产模型及算力生态。据透露，双方将依托通义千问系列开源大模型，重构Manus的底层架构，确保其原有功能在国产硬件平台上实现“零损耗”运行，涵盖智能体开发…...
- 2025年3月14日
- 0
- 10
行业动态

谷歌宣布开源最新模型Gemma-3 号称能媲美DeepSeek

随着DeepSeek的爆火，国内外的人工智能研究机构都压力倍增。近日，谷歌宣布开源最新多模态大模型Gemma-3，主打低成本高性能。Gemma-3共有10亿、40亿、120亿和270亿四种参数。但即便最大的270亿参数，只需要一张H100就能高效推理，同类模型要达到这个效果最少要提升10倍算力，也是目前最强小参数模型。谷歌表示，Gemma-3是一系列轻量级、最先进的开源模型，其构建基于与Gemi…...
- 2025年3月13日
- 0
- 34