美国开放人工智能研究中心(OpenAI)在线上技术直播中发布了最新模型GPT-4.5,作为预览研究逐步向用户开放。OpenAI在新闻稿中表示,这是公司有史以来最大、最好的聊天模型,在计算效率上较GPT-4提升超过10倍。
早期测试显示,与GPT-4.5的交互更加自然,超过OpenAI o1、OpenAI o3-mini并且幻觉非常低;其更广泛的知识储备、更强的用户意图理解能力以及更高的“情商”,使其在优化写作、编程和解决实际问题等任务中表现优异。
OpenAI研究副总裁Mia Glaese表示,“该模型的独特之处在于它能够进行热情、直观、自然流畅的对话,并且我们认为它对用户提出要求时的意思有更强的理解力。”
OpenAI的CEO山姆·奥特曼表示,“对我来说,这是第一个感觉像和一个有思想的人说话的模型。我有几次坐在椅子上,对从人工智能那里得到真正好的建议感到惊讶。”
OpenAI表示,GPT‑4.5是一个非常大且计算密集型的模型,因此它比GPT‑4o更昂贵,并且不能替代GPT‑4o。公司正在评估是否长期在API中继续提供它,所以各位开发者和用户的反馈将决定这款大模型的命运。
GPT‑4.5介绍
1、核心架构
GPT-4.5的核心架构建立在无监督学习和推理能力的结合之上。无监督学习是其基础,通过海量未标注数据的训练,模型能够自主学习语言的结构和模式,从而提高其准确性和直觉能力。使得模型在处理复杂的语言任务时,能够凭借其对语言的深刻理解来生成更加自然和准确的文本。推理能力的引入为模型增加了“思考”推理链的能力,在回答问题之前进行逻辑分析和思考,这在处理需要复杂推理的任务时尤为重要,例如,科学问题、数学问题以及其他需要深度分析的复杂问题。
在预训练完成后,GPT-4.5还使用了复杂的后训练过程。采用了监督微调和基于人类反馈的强化学习相结合的方法。监督微调通过标注数据进一步优化模型的性能,使其在特定任务上表现得更加精准。
在模型规模方面,GPT-4.5是OpenAI迄今为止最大的模型,其参数规模达到了前所未有的高度。为了训练这样一个庞大的模型,OpenAI开发了一系列创新的训练机制。其中,低精度训练技术是关键之一,通过优化计算资源,低精度训练使得模型能够在有限的硬件条件下进行高效的训练。
此外,OpenAI还首次尝试了跨数据中心的分布式训练,利用多个数据中心同时进行预训练,充分利用了大规模计算资源,显著提升了模型的训练效率。
2、情商
GPT-4.5通过一系列技术创新和训练方法为模型增加了“情商”功能,显著提升了其在情感识别、同理心表达以及情感引导等方面的能力,使其在与人类互动时能够展现出更加温暖、细腻且富有同理心的特质。
GPT-4.5能够通过用户的文字输入,敏锐地捕捉到其中的情感色彩,无论是喜悦、悲伤、愤怒还是焦虑。这种能力并非简单地基于关键词的匹配,而是通过深度学习和大量的对话数据训练而来。
模型学会了从语句的整体语境中理解情感的细微差别,从而能够更准确地判断用户的情绪状态。基于这种情感识别能力,GPT-4.5能够以一种富有同理心的方式回应用户。不会简单地给出一些通用的、冷漠的建议,而是会用温暖、关怀的语言来表达对用户情感的理解和支持。
此外,GPT-4.5还具备情感引导的能力。不仅能够回应用户当前的情感状态,还能够通过对话引导用户走向更加积极的情绪状态。
OpenAI现面向所有付费使用层级的开发者,在Chat Completions API、Assistants API和Batch API中提供GPT-4.5预览版。