无论好坏,“推理”人工智能模型已成为一种趋势
2024-12-16 15:10
SinoDAO
2024-12-16 15:10
订阅此专栏
收藏此文章

  //  

推理模型让 AI 走得更远,但它的成本却让人望而却步。

在 OpenAI 发布其所谓的推理模型 o1 之后,来自竞争对手 AI 实验室的推理模型如雨后春笋般涌现。

今年 11 月初,由量化交易员资助的 AI 研究公司 DeepSeek 发布了其首个推理算法 DeepSeek-R1 的预览。同月,阿里巴巴的 Qwen 团队也推出了他们声称是首个“开放”版的 o1 挑战者。

那么,是什么引发了这一波浪潮呢?其中一个原因,是寻找创新的方法来优化生成型 AI 技术。正如我的同事 Max Zeff 最近报道的那样,“暴力破解”式的技术,虽然曾经帮助模型规模化取得进展,但如今已经无法带来过去那样的提升。

AI 公司面临着激烈的竞争压力,必须保持当前创新的步伐。根据估算,全球 AI 市场在 2023 年已达到 1966.3 亿美元,预计到 2030 年将增至 1.81 万亿美元。

OpenAI 表示,推理模型能够“解决比以前更难的问题”,并代表了生成式 AI 发展的一个重大进步。但并不是每个人都确信推理模型是未来发展的最佳路径。

卡内基梅隆大学的机器学习副教授阿米特·塔尔沃卡(Ameet Talwalkar)表示,他对首批推理模型感到“相当印象深刻”。但他也同时提到,他“会质疑那些坚定声称知道推理模型会将行业带向何方的人”。

塔尔沃卡说:“AI 公司有财务动机去描绘他们技术未来版本的光明前景。我们面临的风险是,过于狭隘地关注单一范式,这就是为什么更广泛的 AI 研究社区必须避免盲目相信这些公司所宣扬的炒作和市场营销,而是应该聚焦于切实的结果。”

推理模型的两个主要缺点是:一是成本高,二是能耗大。

以 OpenAI 的 API 为例,使用其推理模型 o1,OpenAI 收费每分析约 75 万字为 15 美元,每生成约 75 万字为 60 美元。这是 OpenAI 最新的“非推理”模型 GPT-4o 的 3 到 4 倍费用。

o1 可以在 OpenAI 的 AI 驱动聊天平台 ChatGPT 上免费使用,但有使用限制。然而,OpenAI 本月早些时候推出了一个更高级的 o1 版本——o1 Pro 模式,年费高达 2400 美元。

加利福尼亚大学洛杉矶分校计算机科学教授盖伊·范登布罗克(Guy Van Den Broeck)告诉 TechCrunch:“大型语言模型推理的总体成本肯定不会下降。”

推理模型成本如此高的一个原因是,它们在运行时需要大量的计算资源。与大多数 AI 不同,o1 和其他推理模型在生成内容时会进行自我检查,这帮助它们避免了通常困扰其他模型的陷阱。然而,这种自我验证也意味着它们往往需要更长的时间来得出结论。

OpenAI 预计,未来的推理模型将“思考”数小时、数天甚至数周。尽管使用成本会更高,OpenAI 承认,但这些推理模型可能带来的突破性成果,从新型电池到新型癌症药物很可能是值得的。

然而,今天的推理模型在价值上并不那么显而易见。非营利组织 Ai2 的研究员兼机器学习工程师 Costa Huang 指出,o1 并不是一个非常可靠的计算器。社交媒体上的简单搜索也能找到许多 o1 Pro 模式的错误。

“这些推理模型是专门化的,可能在一般领域表现不佳,”Costa Huang告诉《TechCrunch》。“一些限制会比其他限制更早被克服。”

盖伊·范登布罗克认为,推理模型并没有真正进行推理,因此它们能成功解决的任务类型也有限。他表示:“真正的推理适用于所有问题,而不仅仅是那些在模型训练数据中可能出现的问题。这个挑战仍然是我们必须克服的主要问题。”

考虑到市场上强烈的动力推动推理模型的发展,我们可以合理推测它们会随着时间的推移不断改进。毕竟,不仅仅是 OpenAI、DeepSeek 和阿里巴巴在投资这一新兴的 AI 研究领域,风险投资家和来自相关行业的创始人也在聚集,共同展望一个由推理 AI 主导的未来。

然而,塔尔沃卡担心,大型实验室可能会“把控”这些进展。

“大型实验室出于竞争原因保持保密是可以理解的,但这种不透明性严重妨碍了研究社区与这些想法的互动,”他说。随着越来越多的人朝这个方向努力,我预计[推理模型]将迅速发展。不过,虽然有些想法将来自学术界,鉴于此领域的经济激励,我预计大多数(如果不是全部)模型将由 OpenAI 等大型工业实验室提供。(TechCrunch)








【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

SinoDAO
数据请求中
查看更多

推荐专栏

数据请求中
在 App 打开