OpenAI 推出 GPT-4.5:最强知识型模型,“AI 味”、幻觉大幅减少
2025-02-28 17:50
巴比特
2025-02-28 17:50
订阅此专栏
收藏此文章

TTPRO1420584-0.png图片来源:由无界 AI 生成


文章来源:腾讯科技


2 月 28 日消息,OpenAI 今日宣布推出其最新旗舰产品 GPT-4.5 语言模型。


这款被称为“迄今为止知识储备最丰富”的 AI 系统将率先面向 Pro 用户和开发者开放研究预览(research preview)。官方特别说明,该模型并非前沿架构版本,在部分场景下的表现可能不及 o1 或 o3-mini 等尖端模型。


从即日起,ChatGPT Pro 用户可以在网页端、移动端和桌面端的模型选择器中选择 GPT-4.5。该模型将于下周开始向 Plus 和 Team 用户推出,随后的一周向企业和教育用户推出。


GPT-4.5 可以访问最新的信息,支持搜索、文件和图像上传,并能通过画布进行写作和代码编辑,目前不支持 ChatGPT 中的多模态功能,如语音模式、视频和屏幕共享。


此外,OpenAI 还在 Chat Completions API、Assistants API 和 Batch API 中向所有付费用户层级的开发者预览 GPT-4.5,支持关键功能,如函数调用、结构化输出、流式传输和系统消息。它还通过图像输入支持视觉能力。



OpenAI 指出,GPT-4.5 是一个非常庞大且计算密集的模型,其使用成本比 GPT-4o 更高,且并非后者的替代品。


GPT-4.5 在预训练和后期训练方面取得了重大突破,通过扩大无监督学习的规模,GPT-4.5 提高了识别模式、建立联系以及生成创造性见解的能力,且这一过程无需直接推理。


早期的测试显示,用户与 GPT-4.5 互动时感觉更加自然。其更广泛的知识库、对用户意图的改进理解以及更高的“情商”(EQ)使其在提高写作、编程和解决实际问题等任务中表现出色。同时,OpenAI 预期 GPT-4.5 的虚构信息将更少,甚至略低于其 o1 模型。


在 SimpleQA(简单问答)测试中,GPT-4.5 在准确性和虚构信息率方面均表现优异


按照山姆·奥特曼披露的信息,OpenAI 计划在 2 月结束前推出 GPT-4.5,并在 5 月底前推出 GPT-5。


OpenAI 首席执行官山姆·奥特曼(Sam Altman)曾把 GPT-5 称为“整合了我们众多技术的系统”,它将包含 OpenAI 在去年 12 月的“圣诞十二日”活动中展示的新 o3 推理模型。


此前,OpenAI 发布了 o3-mini,但完整的 o3 模型仅会作为即将推出的 GPT-5 系统的一部分推出。这与 OpenAI 的目标一致,即整合其大型语言模型,最终打造一个有望被视为通用人工智能(AGI)的更强大模型。


无监督学习提高模型的准确性和直觉


OpenAI 通过扩展两种互补范式来提升 AI 能力:无监督学习和推理,两者代表了智能的两个不同维度。


推理能力的扩展教会了模型在回应之前进行思考和产生思维链,从而使它们能够解决复杂的科学、技术、工程和数学(STEM)或逻辑问题。OpenAI o1 和 OpenAI o3mini 等模型就是这一范式的代表。


相对而言,无监督学习提高了世界模型的准确性和直觉。



当询问 GPT-4.5“第一种语言是什么时,”它给出的答案是:“我们尚不完全清楚第一种语言是什么,并引用各方观点供用户参考。


GPT-4.5 通过扩展计算和数据规模,以及架构和优化创新,实现了无监督学习的扩展。结果是,该模型拥有更广泛的知识和对世界的更深刻理解,从而减少了虚构信息,并在广泛的主题上提高了可靠性。


对话更加符合人类协作的需求


随着 OpenAI 的研究人员扩大模型规模并解决更复杂的问题,教会它们更好地理解人类需求和意图变得越来越重要。


对于 GPT-4.5,研究人员开发了新的可扩展技术,这些技术使得能够利用较小模型的数据来训练更大、更强大的模型。这些技术提高了 GPT-4.5 的可操控性、对细微差别的理解以及自然对话的能力。


在与人类测试者的比较中,GPT-4.5 在创意智力、专业查询和日常查询方面均表现出较高的胜率


将对世界的深刻理解与改进后的协作能力相结合,GPT-4.5 能够在温暖且直观的对话中自然地整合想法,这些对话更加符合人类协作的需求。


GPT-4.5 的回答更像是一个正常人


OpenAI 展示了 GPT-4.5 和 GPT-4o 处理三个相同问题的结果:


问题一:困难时期的帮助



用户‌称,“我考试不及格,现在很难过。” GPT-4.5 的回答拥有更好的情感代入,相比 4o 机械式给解决方案,“AI 味”少了很多。


‌问题二:太空探索



用户‌问“你对太空探索有什么看法?”GPT-4.5 的回答更像是一个正常人,输出自己的见解和观点,GPT-4o 的回答则引经据典,过于学究。


推理能力将是未来模型的核心能力


GPT-4.5 在响应时不进行预先推理,这使得它的优势与 OpenAI 的 o1 等推理模型截然不同。与 OpenAI 的 o1 和 o3-mini 相比,GPT-4.5 是一个更通用、更智能的模型。


OpenAI 相信,推理能力将是未来模型的核心能力,而预训练和推理这两种扩展方法将相互补充。


随着像 GPT-4.5 这样的模型通过预训练变得更智能、更博学,它们将成为推理和工具使用代理的更强大基础。


模型能力提升带来安全性提高


模型能力的每一次提升,也是使其更安全的契机。GPT-4.5 采用了新的监督训练技术,结合了传统的监督微调(SFT)和人类反馈强化学习(RLHF)方法,与 GPT-4o 所使用的方法类似。OpenAI 希望这些工作能为未来更强大的模型对齐提供基础。


为了测试 OpenAI 的改进,研究人员在部署前根据他们的准备框架进行了一系列安全测试。结果发现,扩展 GPT 范式有助于提升 GPT-4.5 在各项评估中的能力。




中国 AIGC 产业应用峰会回顾

2024 年 1 月 5 日,【智求共赢・中国 AIGC 产业应用峰会暨无界 AI 生态合作伙伴大会】在杭州未来科技城会议中心举行。


大会汇集行业资深专家及领军企业,共同聚焦 AIGC 领域,围绕当下热点话题进行深度延展,探讨行业激烈竞争下的运营新思路、发展新模式!点击文章,回顾精彩内容~










AI 新智界园区开放合作啦!


【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

巴比特
数据请求中
查看更多

推荐专栏

数据请求中
在 App 打开