无论好坏，“推理”人工智能模型已成为一种趋势

2024-12-16 15:10

SinoDAO

2024-12-16 15:10

来源链接

订阅此专栏

收藏此文章

推理模型让 AI 走得更远，但它的成本却让人望而却步。

在 OpenAI 发布其所谓的推理模型 o1 之后，来自竞争对手 AI 实验室的推理模型如雨后春笋般涌现。

今年 11 月初，由量化交易员资助的 AI 研究公司 DeepSeek 发布了其首个推理算法 DeepSeek-R1 的预览。同月，阿里巴巴的 Qwen 团队也推出了他们声称是首个“开放”版的 o1 挑战者。

那么，是什么引发了这一波浪潮呢？其中一个原因，是寻找创新的方法来优化生成型 AI 技术。正如我的同事 Max Zeff 最近报道的那样，“暴力破解”式的技术，虽然曾经帮助模型规模化取得进展，但如今已经无法带来过去那样的提升。

AI 公司面临着激烈的竞争压力，必须保持当前创新的步伐。根据估算，全球 AI 市场在 2023 年已达到 1966.3 亿美元，预计到 2030 年将增至 1.81 万亿美元。

OpenAI 表示，推理模型能够“解决比以前更难的问题”，并代表了生成式 AI 发展的一个重大进步。但并不是每个人都确信推理模型是未来发展的最佳路径。

卡内基梅隆大学的机器学习副教授阿米特·塔尔沃卡（Ameet Talwalkar）表示，他对首批推理模型感到“相当印象深刻”。但他也同时提到，他“会质疑那些坚定声称知道推理模型会将行业带向何方的人”。

塔尔沃卡说：“AI 公司有财务动机去描绘他们技术未来版本的光明前景。我们面临的风险是，过于狭隘地关注单一范式，这就是为什么更广泛的 AI 研究社区必须避免盲目相信这些公司所宣扬的炒作和市场营销，而是应该聚焦于切实的结果。”

推理模型的两个主要缺点是：一是成本高，二是能耗大。

以 OpenAI 的 API 为例，使用其推理模型 o1，OpenAI 收费每分析约 75 万字为 15 美元，每生成约 75 万字为 60 美元。这是 OpenAI 最新的“非推理”模型 GPT-4o 的 3 到 4 倍费用。

o1 可以在 OpenAI 的 AI 驱动聊天平台 ChatGPT 上免费使用，但有使用限制。然而，OpenAI 本月早些时候推出了一个更高级的 o1 版本——o1 Pro 模式，年费高达 2400 美元。

加利福尼亚大学洛杉矶分校计算机科学教授盖伊·范登布罗克（Guy Van Den Broeck）告诉 TechCrunch：“大型语言模型推理的总体成本肯定不会下降。”

推理模型成本如此高的一个原因是，它们在运行时需要大量的计算资源。与大多数 AI 不同，o1 和其他推理模型在生成内容时会进行自我检查，这帮助它们避免了通常困扰其他模型的陷阱。然而，这种自我验证也意味着它们往往需要更长的时间来得出结论。

OpenAI 预计，未来的推理模型将“思考”数小时、数天甚至数周。尽管使用成本会更高，OpenAI 承认，但这些推理模型可能带来的突破性成果，从新型电池到新型癌症药物很可能是值得的。

然而，今天的推理模型在价值上并不那么显而易见。非营利组织 Ai2 的研究员兼机器学习工程师 Costa Huang 指出，o1 并不是一个非常可靠的计算器。社交媒体上的简单搜索也能找到许多 o1 Pro 模式的错误。

“这些推理模型是专门化的，可能在一般领域表现不佳，”Costa Huang告诉《TechCrunch》。“一些限制会比其他限制更早被克服。”

盖伊·范登布罗克认为，推理模型并没有真正进行推理，因此它们能成功解决的任务类型也有限。他表示：“真正的推理适用于所有问题，而不仅仅是那些在模型训练数据中可能出现的问题。这个挑战仍然是我们必须克服的主要问题。”

考虑到市场上强烈的动力推动推理模型的发展，我们可以合理推测它们会随着时间的推移不断改进。毕竟，不仅仅是 OpenAI、DeepSeek 和阿里巴巴在投资这一新兴的 AI 研究领域，风险投资家和来自相关行业的创始人也在聚集，共同展望一个由推理 AI 主导的未来。

然而，塔尔沃卡担心，大型实验室可能会“把控”这些进展。

“大型实验室出于竞争原因保持保密是可以理解的，但这种不透明性严重妨碍了研究社区与这些想法的互动，”他说。“随着越来越多的人朝这个方向努力，我预计[推理模型]将迅速发展。不过，虽然有些想法将来自学术界，鉴于此领域的经济激励，我预计大多数（如果不是全部）模型将由 OpenAI 等大型工业实验室提供。”（TechCrunch）

来源链接

【免责声明】市场有风险，投资需谨慎。本文不构成投资建议，用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。

数据请求中

数据请求中

在 App 打开

推荐专栏