OpenAI 推出 GPT-4.5：最强知识型模型，“AI 味”、幻觉大幅减少

2025-02-2817:50

巴比特

2025-02-28 17:50

巴比特

2025-02-28 17:50

收藏文章

订阅专栏

图片来源：由无界 AI 生成

文章来源：腾讯科技

2 月 28 日消息，OpenAI 今日宣布推出其最新旗舰产品 GPT-4.5 语言模型。

这款被称为“迄今为止知识储备最丰富”的 AI 系统将率先面向 Pro 用户和开发者开放研究预览（research preview）。官方特别说明，该模型并非前沿架构版本，在部分场景下的表现可能不及 o1 或 o3-mini 等尖端模型。

从即日起，ChatGPT Pro 用户可以在网页端、移动端和桌面端的模型选择器中选择 GPT-4.5。该模型将于下周开始向 Plus 和 Team 用户推出，随后的一周向企业和教育用户推出。

GPT-4.5 可以访问最新的信息，支持搜索、文件和图像上传，并能通过画布进行写作和代码编辑，目前不支持 ChatGPT 中的多模态功能，如语音模式、视频和屏幕共享。

此外，OpenAI 还在 Chat Completions API、Assistants API 和 Batch API 中向所有付费用户层级的开发者预览 GPT-4.5，支持关键功能，如函数调用、结构化输出、流式传输和系统消息。它还通过图像输入支持视觉能力。

OpenAI 指出，GPT-4.5 是一个非常庞大且计算密集的模型，其使用成本比 GPT-4o 更高，且并非后者的替代品。

GPT-4.5 在预训练和后期训练方面取得了重大突破，通过扩大无监督学习的规模，GPT-4.5 提高了识别模式、建立联系以及生成创造性见解的能力，且这一过程无需直接推理。

早期的测试显示，用户与 GPT-4.5 互动时感觉更加自然。其更广泛的知识库、对用户意图的改进理解以及更高的“情商”（EQ）使其在提高写作、编程和解决实际问题等任务中表现出色。同时，OpenAI 预期 GPT-4.5 的虚构信息将更少，甚至略低于其 o1 模型。

在 SimpleQA（简单问答）测试中，GPT-4.5 在准确性和虚构信息率方面均表现优异

按照山姆·奥特曼披露的信息，OpenAI 计划在 2 月结束前推出 GPT-4.5，并在 5 月底前推出 GPT-5。

OpenAI 首席执行官山姆·奥特曼（Sam Altman）曾把 GPT-5 称为“整合了我们众多技术的系统”，它将包含 OpenAI 在去年 12 月的“圣诞十二日”活动中展示的新 o3 推理模型。

此前，OpenAI 发布了 o3-mini，但完整的 o3 模型仅会作为即将推出的 GPT-5 系统的一部分推出。这与 OpenAI 的目标一致，即整合其大型语言模型，最终打造一个有望被视为通用人工智能（AGI）的更强大模型。

无监督学习提高模型的准确性和直觉

OpenAI 通过扩展两种互补范式来提升 AI 能力：无监督学习和推理，两者代表了智能的两个不同维度。

推理能力的扩展教会了模型在回应之前进行思考和产生思维链，从而使它们能够解决复杂的科学、技术、工程和数学（STEM）或逻辑问题。OpenAI o1 和 OpenAI o3mini 等模型就是这一范式的代表。

相对而言，无监督学习提高了世界模型的准确性和直觉。

当询问 GPT-4.5“第一种语言是什么时，”它给出的答案是：“我们尚不完全清楚第一种语言是什么，并引用各方观点供用户参考。

GPT-4.5 通过扩展计算和数据规模，以及架构和优化创新，实现了无监督学习的扩展。结果是，该模型拥有更广泛的知识和对世界的更深刻理解，从而减少了虚构信息，并在广泛的主题上提高了可靠性。

对话更加符合人类协作的需求

随着 OpenAI 的研究人员扩大模型规模并解决更复杂的问题，教会它们更好地理解人类需求和意图变得越来越重要。

对于 GPT-4.5，研究人员开发了新的可扩展技术，这些技术使得能够利用较小模型的数据来训练更大、更强大的模型。这些技术提高了 GPT-4.5 的可操控性、对细微差别的理解以及自然对话的能力。

在与人类测试者的比较中，GPT-4.5 在创意智力、专业查询和日常查询方面均表现出较高的胜率

将对世界的深刻理解与改进后的协作能力相结合，GPT-4.5 能够在温暖且直观的对话中自然地整合想法，这些对话更加符合人类协作的需求。

GPT-4.5 的回答更像是一个正常人

OpenAI 展示了 GPT-4.5 和 GPT-4o 处理三个相同问题的结果：

问题一：困难时期的帮助

用户‌称，“我考试不及格，现在很难过。” GPT-4.5 的回答拥有更好的情感代入，相比 4o 机械式给解决方案，“AI 味”少了很多。

‌问题二：太空探索

用户‌问“你对太空探索有什么看法？”GPT-4.5 的回答更像是一个正常人，输出自己的见解和观点，GPT-4o 的回答则引经据典，过于学究。

推理能力将是未来模型的核心能力

GPT-4.5 在响应时不进行预先推理，这使得它的优势与 OpenAI 的 o1 等推理模型截然不同。与 OpenAI 的 o1 和 o3-mini 相比，GPT-4.5 是一个更通用、更智能的模型。

OpenAI 相信，推理能力将是未来模型的核心能力，而预训练和推理这两种扩展方法将相互补充。

随着像 GPT-4.5 这样的模型通过预训练变得更智能、更博学，它们将成为推理和工具使用代理的更强大基础。

模型能力提升带来安全性提高

模型能力的每一次提升，也是使其更安全的契机。GPT-4.5 采用了新的监督训练技术，结合了传统的监督微调（SFT）和人类反馈强化学习（RLHF）方法，与 GPT-4o 所使用的方法类似。OpenAI 希望这些工作能为未来更强大的模型对齐提供基础。

为了测试 OpenAI 的改进，研究人员在部署前根据他们的准备框架进行了一系列安全测试。结果发现，扩展 GPT 范式有助于提升 GPT-4.5 在各项评估中的能力。

中国 AIGC 产业应用峰会回顾

2024 年 1 月 5 日，【智求共赢・中国 AIGC 产业应用峰会暨无界 AI 生态合作伙伴大会】在杭州未来科技城会议中心举行。

大会汇集行业资深专家及领军企业，共同聚焦 AIGC 领域，围绕当下热点话题进行深度延展，探讨行业激烈竞争下的运营新思路、发展新模式！点击文章，回顾精彩内容~

AI 新智界园区开放合作啦！

【免责声明】市场有风险，投资需谨慎。本文不构成投资建议，用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。

数据请求中

一起「遇见」未来

DOWNLOAD FORESIGHT NEWS APP

App Store

Android

推荐专栏

一起「遇见」未来