我在硅谷看 AI:Deepseek 狂飙背后,2025 年 15 条 AI 关键投资启示
2025-02-08 07:00
硅兔赛跑
2025-02-08 07:00
订阅此专栏
收藏此文章

作者:王子、顾程来、Evan、李海丹
编辑:李海丹
封面来源:美剧《硅谷》


#01
开篇

生成式 AI,作为当今最具颠覆性的技术之一,正在引领各行业进入全新的发展阶段。

2025 年伊始,围绕生成式人工智能的竞赛愈发激烈。美国总统特朗普上任第二天,白宫宣布启动名为“星际之门”(Stargate)的人工智能项目,由美国甲骨文公司、OpenAI 与日本软银集团联合出资打造。

1 月 14 日,OpenAI 推出了名为 Tasks 的测试版功能,标志着 ChatGPT 正式迈入 AI 智能体(AI Agent)阶段。春节期间,中国大模型 DeepSeek 凭借其推理模型 DeepSeek-R1 引起了广泛关注,该模型以 OpenAI 十分之一的成本达到了 GPT-o1 的同级别表现。同时,DeepSeek 在 1 月 26 日登顶苹果 App Store 和谷歌 Play Store 全球下载榜首,上线 18 天内下载量突破 1600 万。

紧接着,OpenAI 继续推动创新,发布动作不断:1 月 24 日发布了一款代号为“Operator”的全新 AI Agent 产品;随后 2 月 1 日推出 o3-mini,专注于 STEM 领域,支持函数调用、流式传输、结构化输出和搜索结合等功能;2 月 3 日又推出面向深度研究领域的智能体产品,进一步拓展了其在专业领域的应用。谷歌也不甘示弱,在 2 月 6 日凌晨发布了性能更强的 Gemini 2.0 系列模型,包括 Pro、Flash 和 Flash-Lite 三个版本。

如今,生成式 AI 正迎来类似的历史时刻,这不仅是科技革命,更是商业重塑的契机,我们正站在这一变革的起点。每一次平台级机会的背后,都会催生出一批市值百亿、千亿美金的公司。从互联网到移动互联网,再到云计算和区块链,每一次基础设施的创新都激发了无数新的应用场景,推动科技巨头的崛起。

回顾这些历史周期,我们发现,基础设施的完善往往会催生应用公司的黄金发展期。生成式 AI 作为新型基础设施,正处于这一发展轨道的起点。未来,这些公司将通过创新的商业模式和智能化产品,重新定义我们的工作和生活方式,迎来属于自己的千亿市值时代。展望 2025 年,大语言模型将会走向何方?在这份报告中,我们将从行业变化、技术进展和应用趋势三方面,对大模型的未来发展进行深入前瞻。


#02

AI 疯狂吸金,千亿独角兽冉冉升起


2024 年,最为人们印象深刻的,便是生成式 AI 公司——OpenAI 高达 65 亿美元的融资。这笔融资让这位生成式 AI 的弄潮儿估值达到约 1500 亿美元——一只大型千亿独角兽正在硅谷茁壮成长,而这只是 2024 年中最具代表性的一个。生成式 AI 所创造出的“造富神话”,多次让人们情绪高涨,AI 就像一个庞大的“吸金兽”,以飓风般的速度吸走了大部分的风投资金。
 
涌入 AI 赛道的大量资金和顶尖创业者,正在催生出了一批新晋独角兽公司。根据硅兔君复盘,在过去 18 个月新增的 73 家独角兽中,有 28 家是 AI 公司,占到了新增独角兽的大约三分之一。例如特斯拉创始人埃隆·马斯克在 2023 年 7 月创立的 xAI,2024 年 3 月发布了首款 AI 聊天机器人 Grok-1,随后发布了 Grok-1.5V 大模型,其在最新一轮融资中,估值达到 240 亿美元;Xaira Therapeutics,作为 AI+ 生物技术领域的公司,其联合创始人 David Baker 在“AI+ 蛋白质”领域颇有造诣,其团队研发出 AI 大模型 RFdiffusion,用扩散模型构建的创新型生成式 AI 系统,并且可以按需构建 AI 分子,估值为 27 亿美元;Cognition AI 是一家由三位华人创业者创立的公司,2024 年 3 月,其推出了世界上第一位完全自主的 AI 软件工程师,在最新一轮融资后估值达到 20 亿美元。

制图:硅兔赛跑,数据来源 pitchbook

制图:硅兔赛跑,数据来源 pitchbook
 
这些 AI 独角兽的成长速度远快于非 AI 独角兽,前 25% 的 AI 公司在不到 2.5 年内就已经达到独角兽估值。同时,最大规模的交易也流向了 AI 的初创企业。
 
另一个趋势是——融资额正在变大,头部效应更加明显。根据第三方数据分析机构 Pitchbook 的数据,2024 年,光是北美的风险投资总金额达到了 2164 亿美金,较 2023 年增长了 28%。其中 2024 年四季度,北美地区的融资额达到了 771 亿美金,创下了 2 年以来的新高,光是人工智能相关项目的投融资额达到了 991 亿美金,占到了总额的 45.8%,达到了历史最高水平。过去美国最大的 10 笔风险投资交易每年通常占总融资额的 9% 左右,而自 2023 年以来,这一比例升至 20%。

过去一年,我们在硅谷,这个北美将近 50% 投融资发生的地区以及最能够代表北美创投发展的地方,捕捉到最新的一些变化并试图梳理出最前沿的趋势:

首先,针对人工智能创投领域,有四大行业趋势值得关注:

1、如果说 2023 年的 AI Agent,只是停留在诸如斯坦福小镇这样的虚拟世界;2024 年,AI Agent 的商业化条件逐渐成熟;2025 年则是 Agent AI 商业化的元年,资本的关注和注入加速,会加剧各大科技公司和初创企业在 Agent AI 领域的竞争,推动技术创新和产业应用的落地。

2、一方面围绕生成式 AI 基础设施的投资规模空前,带动了一系列产业链公司;另一方面,业界正在尝试一些低成本、性价比高的做法,减少训练的投入却能达到与 GPT-4/4o 等同的效果;

3、专有 AI 模型正在释放 AI 潜力,他们正在解决通用大模型不能解决的问题,逐步具备较高的商业化潜力。

4、生成式界面将迎重大发展,用户能够有更好的互动体验,将带来新的商业模式和市场机会。

其次,在人工智能的技术方面,我们总结了八大趋势:

1、2025 年,大模型将更加关注多模态的融合与交互,其训练方法正在不断优化;

2、一直以来,尽管大模型能力在不断增强,但仍无法解决人工智能的“黑箱”问题。2024 年,许多公司陆续推出了更透明的模型架构和解释工具以缓解“黑箱”带来的麻烦。2025 年,可解释性工具将进一步普及;

3、2024 年,大模型的长期记忆能力迎来了一系列技术突破。2025 年,随着多模态技术的进步,跨模态记忆融合将在视频、文本、触觉和嗅觉数据的编码上取得突破,进一步提升模型的记忆能力。

4、合成数据作为加速大模型训练的方法,将在 2025 年进一步发挥潜能。

5、2025 年,随着更强大的计算资源的普及和优化,规模定律将继续提升,这使得更多的中小型企业可以进入 AI 领域,加速了大模型的普及,效率跃迁曲线下,大模型的成本更低了。

6、2025 年,强化学习(RL)与大语言模型的结合有望进一步提升模型的泛化能力,并使得从预训练到后训练和推理迁移的转变成为可能。

7、随着 AI 应用场景的多样化,简化算法架构将成为 AI 发展的重要方向。2025 年,更多优化算法将被用于强化学习等领域,以减少计算资源的消耗。

8、随着 AI 蒸馏技术的普及,相关的法律和监管框架也需要不断加强,以确保在模型开发和应用过程中不会侵犯知识产权或数据隐私。

另外,在人工智能的应用方面,2025 年也有了一些新的变化:

1、2025 年,企业级 AI 应用迎来深入发展,越来越多企业将从人工智能中获利。AI Agent 成为行业颠覆性力量,生成式 AI 推动传统行业进入智能化时代。随着企业在生成式 AI 上盈利,商业模式转变为按工作成果收费,取代传统的 SaaS 席位收费。

2、2025 年对于 AI 应用来说,下一个重大事件将属于消费。我们期待一个“杀手级”AI 消费应用的诞生。

3、在 AI 应用端,企业不再依赖单一模型,而是会根据不同的应用需求和场景,将不同模型模块进行组合,定制出符合自己业务需求的模型。

趋势一 :2025 年,AI Agent 元年拉开序幕

 
人工智能未来学家雷·库兹韦尔 (Ray Kurzweil) 表示,2025 年,我们将开始看到从聊天机器人和图像生成器向“代理”系统的转变,这些系统可以自主完成任务,而不仅仅是回答问题。人工智能系统正在从单一的交互模式,走向专门且相互关联的代理。

AI Agent,也称为人工智能代理,通常是指能够感知环境、进行自主理解、决策和执行动作的智能体。根据咨询公司来觅 PEVC 的统计,自 2024 年以来,全球 AI Agent 赛道的融资金额已突破 665 亿元人民币。从整体来看,这些资金主要流向了在技术与市场潜力方面处于领先地位的头部企业。

科技巨头纷纷布局 AI Agent,以抢占未来智能交互的制高点。2024 年,OpenAI 凭借其强大的技术实力和广泛的市场应用,官宣 65 亿美元新融资,成为万亿独角兽,也成为全球 AI Agent 领域的主要资金流之一。埃隆·马斯克创立的 xAI,希望将 AI Agent 与人类深度整合,创建全球首个 AI Agent 与人类共存的社交平台,xAI 在 2024 年 12 月完成 60 亿美元融资,估值达到了近 500 亿美元。谷歌也全力推广商用 AI Agent,发布了全球为数不多的商用 AI Agent 市场,为企业提供一站式开发、部署和应用生态。微软在 2024 年 11 月的 Ignite 大会上宣布已建立全球规模最大的企业级 AI Agent 生态系统,企业用户可通过 Azure AI 目录访问超过 1800 个 AI 模型。此外,微软的 Copilot Studio 平台已支持用户创建自主 Agent,并正式进入预览阶段。苹果也在开发者大会上展示了其最新的 AI 成果 Apple Intelligence。

2025 年,OpenAI 推出的智能体功能(AI Agent)以及一系列基于生成式 AI 的智能系统,它们开始具备真正的自主学习和推理能力,从单一任务的执行者,转变为能够进行多任务处理、复杂决策和交互的智能体——1 月 24 日,OpenAI 发布了一款代号为“Operator”的全新 AI Agent 产品,与其他各家 Agent 相比,它会通过自有的 CUA(电脑控制 Agent)系统进行复杂的思维链反思和步骤规划,这可以大大提高其完成任务的精度和复杂性。Operator 的创新之处在于其成功实现了从认知到执行的完整闭环。这一能力的拓展不仅是技术上的突破,更是 AI 技术迈向更高层次发展的关键一步。

AI Agent 不再是单一的辅助工具,而是可以独立进行深度学习、理解和推理的智能系统,赋能企业和个人高效完成复杂任务,推动生产力的大幅提升。2025 年,AI 智能体的全面普及将不仅改变技术产业的格局,还将在各个领域深刻影响人类的生活方式,从而使这一年成为 AI Agent 真正崭露头角的元年。


趋势二:基础设施军备竞赛:投资空前,低成本做法渐成趋势


一年多以前,基础大模型制造商 OpenAI,在芯片制造商英伟达生产的 25000 个最新进 GPU 集群上训练了 GPT-4。随后,马斯克表示他在一个数据中心有 100000 个 GPU,并计划购买 200000 个。

头部公司通过大规模资金投入,抢占人工智能基础设施的制高点,而以英伟达为代表的硬件厂商也在以前所未有的速度上不断突破技术极限。例如,英伟达的顶级芯片性能相当于 300 部高端 iPhone 的处理能力。

在这场基础设施竞争中,埃隆·马斯克的 X 平台部分业务——xAI 的“Colossus”训练集群,成为世界上最强大的人工智能训练集群之一。这个集群仅用 122 天便建成,预算高达 30 亿至 40 亿美元,成为人工智能基础设施建设的里程碑。目前,xAI 计划将集群容量翻倍,进一步增强处理能力。Meta 也在大规模投资硬件,近期公布了其 24000 个 GPU 数据中心规模集群的两个版本,旨在支持其下一代人工智能模型。

虽然目前 GPU 集群比传统数据中心小,但对人工智能计算不断增长的需求将需要大规模的基础设施扩展。包括 Meta、亚马逊、Alphabet 和微软在内的主要科技公司正在推动对人工智能基础设施的空前投资。超大规模数据中心运营商预计 2024 年资本支出(CapEx)将超过 2000 亿美元,到 2025 年这一数字预计将接近 2500 亿美元。尽管并非所有支出都直接与人工智能相关,但很大一部分都分配给了人工智能,并且这个份额在不断增加。微软和 OpenAI 已讨论推出一个专门用于人工智能工作负载的 5 千兆瓦数据中心,可能耗资超过 1000 亿美元,甚至可以买得下一艘最新型核动力航空母舰。

在这场人工智能基础建设中受益的,是这个产业链中的组成部分。

第一类就是数据中心的托管服务提供商——也就是向大公司提供数据中心租赁容量的公司,他们是数据中心市场的重要组成部分。这批数据中心的托管服务提供商如今也在拓展其以人工智能为重点的基础设施服务。例如,超大规模托管领域的领导者 Equinix 已获得近 150 亿美元的资金用于在美国建设人工智能数据中心,主要为客户提供基础设施,以训练和部署大规模私有人工智能模型,这些客户往往是科技行业以外的财富 500 强公司。

另一类受益者则是人工智能数据中心建设中的辅助产品,例如低功耗 CPU、内存、存储系统、网络组件以及冷却和电源管理设备。冷却产品供应商 Vertiv 在 2024 年 7 月至 9 月的三个月内实现了 19% 的同比收入增长,并提高了未来 12 个月的业绩指引。

第三类则是围绕数据中心能源生产、热管理和电源管理解决方案的公司。Alphabet 董事长在 2023 年 2 月表示,与 LLM 互动可能比标准关键字搜索的花费高出 10 倍。另外,根据谷歌研究员 Urs Hölzle 的文章提及,标准 Google 搜索使用的电力为 0.3Wh,这意味着每次 LLM 互动的耗电量约为 3Wh。这个数字与 SemiAnalysis 在 2023 年初对 ChatGPT 运营成本的评估一致,该评估估计 ChatGPT 每次请求耗电量为 2.9Wh,如果每天响应 1.95 亿个请求,估计平均每天耗电量为 564MWh。

《纽约客》报道称,ChatGPT 每天用电量相当于 1.7 万个美国家庭的用电量。如果基于当前模型和技术,让每个标准 Google 搜索都变成 LLM 交互,对 Google 总用电量的潜在影响巨大。第三方分析机构 SemiAnalysis 估计,带有大模型交互功能的谷歌搜索单次请求的用电量达到将近 9Wh,谷歌每天搜索大约需要 90 亿次,则需要 81000MWh。

这一趋势促使人们对位于数据中心设施附近的核能和能源生产等技术以及热管理和电源管理解决方案进行投资。

不过,如今科学家和业界正在寻找更聪明并且资源密集度更低的方法来解决训练人工智能模型所需要的算力和能源问题。例如通过蒸馏技术,这项技术的践行者——DeepSeek,这家国产大模型也给美国硅谷提供了更多低成本的训练参考。DeepSeek 大模型性能在多个方面比肩 OpenAI,其中 DeepSeek V3,整个训练过程仅用了约 2000 张二流芯片进行训练,官方称成本仅占用约 550 万美元,而 Meta 的模型则使用了 16000 个性能最强的一流芯片。并且,DeepSeek-R1 通过重新设计训练流程、以“少量 SFT 数据 + 多轮强化学习”的办法,在提高了模型准确性的同时,也显著降低内存占用和计算开销,每百万输出 tokens16 元,大约是 OpenAI o1 运行成本的三十分之一。

在这样的竞争压力下,0penAI 推出了其成本更低的 o3-mini,比 o1-mini 便宜 63%,比完整的 o1 模型便宜 93%,每百万 tokens 的进出费用分别为 1.10 美元 /4.40 美元 ( 享有 50% 的缓存折扣 )。谷歌发布的 Gemini 2.0 Flash-Lite 是 Gemini 2.0 系列的新变体,每百万 tokens0.3 美元,是谷歌目前最便宜的模型。

可以窥见,在 AI 产业的竞争中,降低训练成本、提高计算效率和优化模型性能已成为企业的主要竞争策略。尤其是训练流程的优化,成为了公司在大模型市场中占据竞争优势的关键能力之一。2025 年,低成本做法也将成为行业的主流趋势。

此外,一些大公司也在开发专用人工智能芯片,例如谷歌、苹果、微软和 OpenAI,这些专业芯片可以比英伟达这样通用处理器运行更高效;或是采用一些方法提高芯片的使用效率,例如用多种模型,每种模型针对不同问题,以此来缩短芯片的处理时间等。AI 推理芯片制造商 Groq2024 年估值达到 28 亿美元,在 Blackrock 领投的新一轮中融资 6.4 亿美元,其专为 AI 推理任务设计的芯片“语言计算单元”(LPU, language processing unit)能以现有解决方案 1/10 的价格、10 倍的速度运行与 ChatGPT、GPT-4o 相似的模型。目前,在 Groq 开发的、对标英伟达 CUDA 的软件开发平台 GroqCloud 平台上,约有 40 万开发者。

趋势三:专有模型有望释放 AI 的应用潜力


大模型就像个通才,然而,在一些专业领域,大模型往往缺乏针对性和操作性。为了突破这一瓶颈,越来越多的公司开始专注于开发专有模型,通过在特定领域数据上微调模型,实现更高效的工作流程自动化,提供更具操作性和任务导向的工具。这一趋势正在逐步升温,并在多个行业展现出巨大的应用潜力。以下为一些具体的案例:

金融服务领域,提升决策效率与洞察力:摩根大通和彭博社等机构正在利用其庞大的内部数据集开发大语言模型,以提升运营效率和决策能力。这些模型能够提供独特的市场洞察、风险分析和报告生成。例如,彭博社于 2023 年开发了 BloombergGPT,专注于金融领域的数据分析和预测,通过微调金融数据,能够更高效地处理复杂的金融任务,如市场趋势分析和投资策略制定。

网络安全领域,精准检测与应对威胁:美国网络安全解决方案提供商 Palo Alto Networks 正在训练自有的大语言模型,这些模型能够帮助安全专家更好地检测和应对网络威胁。该公司在 2024 财年四季度披露了超过 2 亿美元的 AI 相关经常性收入,同比增幅近四倍。AI 大模型通过模拟复杂攻击场景,帮助安全团队快速发现系统漏洞并提供修复建议,显著提升了网络安全的实时预警和用户行为分析能力。

国防领域,用于军事与情报分析:美国数据分析和软件公司 Palantir 近期获得了一系列合同,用于支持 AI 的服务,包括加速部署适用于国防和军事领域的 AI 模型。这些模型能够提升情报分析、目标识别和决策支持能力。例如,AI 训练平台可以创建逼真的战斗场景,帮助士兵在安全环境下进行战术训练。此外,AI 技术在军事领域的应用还包括无人化作战系统和沉浸式训练模拟。

生命科学领域:2024 年,科研人员使用 AI 的比例快速增加,AI 对科学研究方法和流程的变革效应也开始显现。比如,AlphaFold 3.0 在 2024 年发布,不仅提高了蛋白质结构预测的准确率,还扩展到了 DNA 和 RNA 等生物分子的研究,这项技术帮助科学家快速预测药物分子与目标蛋白质的结合情况,大大提高了药物研发的效率。2025 年,多模态大模型将进一步融入科学研究,赋能多维数据的复杂结构挖掘,辅助科研问题的综合理解与全局分析,为生物医学、气象、材料发现、生命模拟、能源等基础与应用科学的研究开辟新方向。

除了上述领域,专有模型还在其他行业展现出广泛的应用前景。例如,Two Sigma 在量化投资中使用 AI Agent 进行选股策略,通过分析财务数据和宏观经济指标,识别潜在的投资机会。Shopify Sidekick 则利用 LLama 2 生成产品描述、回应客户查询和创建营销内容,帮助小企业主提升运营效率。

专有模型通过在特定领域的数据上进行微调,能够提供更具针对性和操作性的解决方案。这种趋势不仅提升了各行业的自动化水平,还为企业带来了显著的运营效率提升和成本降低。随着 AI 技术的不断发展,未来专有模型将在更多领域得到广泛应用,成为推动行业创新的重要力量。

趋势四:推动动态自适应界面,实现高度个性化的交互体验


生成式界面(Generative Interface)是指利用生成式模型,如生成对抗网络(GANs)或变分自编码器(VAEs),自动创建用户界面元素或交互流程。这种界面不是通过传统设计方法人工制作,而是通过机器学习算法根据输入的数据、需求或上下文生成。

在 2024 年,生成式用户界面(Generative UI)在动态和自适应界面、AI 与算法融合、个性化体验等方面取得了显著进展。大规模生成式预训练模型(如 GPT 系列、DALL·E 等)已被广泛应用于自动化界面设计。开发者借助这些模型,可以快速生成和调整界面元素,如按钮、布局、色彩搭配等,甚至可以根据用户反馈实时调整界面的外观和功能。

此外,生成式界面逐步在增强现实(AR)和虚拟现实(VR)环境中得到应用,尤其是在需要复杂交互的沉浸式体验中,AI 帮助生成自适应、动态变化的虚拟界面。例如,英伟达在 2024 年 SIGGRAPH 大会上展示了利用实时生成式 AI 创建沉浸式沙漠世界的研究成果。此外,英伟达还通过 Holoscan 技术赋能手术机器人,加速 AI 技术在医疗实践中的应用。这些应用展示了生成式 AI 在动态生成虚拟界面方面的潜力,尤其是在需要高度沉浸感的场景中。

可以说,随着用户需求变得更加多样化和复杂,传统的固定界面无法满足个性化的交互需求。动态自适应界面能够根据用户的行为、偏好和环境变化实时调整显示内容和功能,提供更加定制化的体验。

展望 2025 年,生成式界面将迎来重大发展,成为推动用户体验变革的关键力量。越来越多的应用将采用基于用户交互和逻辑工作流程自适应的动态用户界面。生成式 UI 将使应用能够自动生成表单、仪表板或可视化等界面元素,这些元素将根据用户的具体需求和操作量身定制。例如,Web 开发平台 Vercel 和 Bolt.new 等公司正在开发能够创建高度适应性和个性化用户体验的平台,提供实时演进的界面,以满足不断变化的需求,从而简化工作流程。


#03

八大技术趋势,推动 AI 泛化能力


趋势一:多模态能力的增强和集成


2024 年,多模态 AI 取得了显著进展。OpenAI、Google DeepMind 等机构推出了更强大的多模态模型,如视频生成模型 Sora 的诞生、OpenAI 多模态 AI 大模型 GPT-4o 的到来、CLIP 模型通过跨模态表示实现图文搜索,用户可以通过输入文本搜索相关图像或视频。此外,文本到图像生成(如 DALL·E、Stable Diffusion)和视频生成模型也取得了显著进展,进一步拓展了 AI 的交互体验。
大模型逐步增加了能够处理图像、音频或视频等多种输入形式。这些模型不仅提升了 AI 对复杂信息的处理能力,还拓展了其应用领域。在谷歌云发布的《2025 年 AI 商业趋势》报告中,多模态 AI 被放在首位。谷歌云预测,2025 年将成为企业采用 AI 技术的关键一年,这一趋势主要由多模态学习及其实现的情境感知所驱动的,并预计 2025 年全球多模态 AI 市场规模将达到 24 亿美元。

2025 年,大模型将更加关注多模态融合与交互。AI 不仅能够生成文本,还能理解图像、视频中的上下文,甚至在多模态环境中进行决策。比如,结合视觉与语音的能力,模型能够更好地理解复杂的场景,并做出合适的反应。

此外,多模态模型的训练方法也在不断优化,例如采用分阶段训练策略,先固定大语言模型的权重参数,对图像编码器和桥接组件进行初步训练,再进行整体训练,从而提升模型性能。

趋势二:大模型的可解释性表现更强


可解释人工智能 (xAI) 是人工智能领域的一个新兴领域,致力于使人工智能系统对人类更加透明、可解释和可理解。xAI 的兴起源于人们对人工智能决策过程透明度和问责制的需求日益增长,尤其是随着人工智能系统变得越来越复杂并部署在金融、法律或医疗保健等高风险领域。例如,考虑医院用于筛查患者 X 光片的肿瘤检测 CNN(卷积神经网络) 模型的情况。但是,当技术人员或患者不知道其工作原理时,他们如何能相信其结果?这正是我们需要方法来了解影响任何深度学习模型决策的因素的原因。

另外,AI 的安全性问题是一个不可忽视的关键挑战。尤其是大模型在做出决策时的“思考过程”对于用户和开发者来说变得不透明,就像一个“黑箱”,其决策过程难以解释和追踪。若这些模型未经过严格的审查和验证,它们可能会做出无法被察觉的有害决策,甚至加剧社会偏见和不公。因此,加强对大模型的监控、审查和可解释性要求是提升 AI 系统安全性的重要一步。

2024 年,大模型的可解释性取得了重要进展。OpenAI、Google DeepMind 等机构推出了更透明的模型架构和解释工具,如 GPT-4 的可解释性增强版本和 Gemini 的跨模态解释功能。LIME、SHAP 等后验解释方法被广泛应用于医疗、金融等领域,帮助用户理解模型决策依据。同时,自监督学习和符号 AI 的结合提升了模型的内在可解释性,减少了“黑箱”问题。行业也开始重视可解释性的标准化,例如欧盟《人工智能法案》要求高风险 AI 系统提供清晰的决策解释。

2025 年,可解释性工具将进一步普及,将模型将内置更强大的解释能力,实时生成决策依据,并支持多模态数据的跨模态解释,帮助用户理解复杂 AI 模型的决策过程。通过一些自主进化模式或可解释性工具,将模型将内置更强大的解释能力,实时生成决策依据,并支持多模态数据的跨模态解释。可解释性与性能的平衡将得到优化,知识蒸馏和模型压缩技术将帮助简化复杂模型的同时保持高精度。行业专用可解释性工具将普及,满足医疗、金融等领域的合规需求。

以 DeepSeek 为例,通过纯算法自主进化的 Zero 模式与仅需数千条人工标注数据的 R1 模式组合既保留模型自主进化能力又保障人类可解释性————Zero 模式使得模型能够自我进化和发现数据中的规律,而 R1 模式通过引入人工标注数据为模型提供了一个监督和解释的框架。这种结合确保了模型在保持自主学习能力的同时,也能够被人类理解和控制,从而提升了可解释性。

此外,伦理和隐私保护将深度融入可解释性设计,确保 AI 系统既透明又安全,推动大模型在高风险场景中的广泛应用。以下是一些提升的方向和工具:

○ 自监督学习与模型可解释性:通过自监督学习,AI 系统可以在缺乏大量标注数据的情况下,通过理解数据的内在结构来进行学习,这种方法有助于提升模型的透明度,使得我们能够更好地理解其学习过程。

○ 生成对抗网络(GANs)和模型蒸馏:通过生成对抗网络和蒸馏技术,开发者能够简化复杂模型,同时保持高效性和准确性,这种方法使得大规模深度学习模型更加易于解释。

○ 增强推理框架和可视化工具:新一代的 AI 推理框架将更注重可视化,帮助用户以更直观的方式理解模型决策的依据。例如,基于图像或文本的 AI 系统,新的可视化工具可以清晰展示模型如何关注不同的输入特征,从而提升其可解释性。

需要一提的是,未来 AI 的安全不光需要提升可解释性,还需要着重于法律合规性、安全审计和滥用防范等方面,推动 AI 技术的负责任应用。随着技术的不断发展,AI 如何在不断的创新中确保安全,将成为 AI 领域面临的重大挑战之一。


趋势三:大模型长期记忆能力迎来深层次变革


目前的许多大模型(如基于 Transformer 架构的模型)在处理长文本或复杂上下文时,常常会面临信息丢失等问题。传统模型一般有固定的“记忆窗口”,当文本或输入信息过长时,模型往往会忘记最初的信息,或者在处理过程中只关注较近的上下文。长期记忆的核心需求是让模型能跨越多个时刻、任务和场景记住信息,并能在合适的时机提取和利用这些信息。

大模型的长期记忆能力迎来了一系列技术突破。首先,在上下文窗口的扩展上,比如 2024 年,Google Gemini 1.5 Pro 突破性地实现了最高可达 1000 万 token 的处理能力。到 2025 年 2 月发布的 Gemini 2.0 全家桶,最强 Pro 版本可支持到 2M 上下文。

其次,外部记忆系统的引入推动了大模型记忆能力的发展。如 IBM WatsonX 的实时知识图谱更新功能使得在医学诊断等特定领域的记忆准确率提高了 35%。持续学习机制方面,Meta 的 LoRA-X 架构通过参数隔离技术降低了多任务干扰,OpenAI 则部署了分布式记忆训练系统,使百万设备协同进化,提升了记忆系统表现。在记忆检索方面,Anthropic 的 ContextRouter 模块和微软的 MAVEx 系统分别通过动态记忆权重分配和跨模态联合检索,优化了记忆检索的准确性与效率。

第三,隐私与安全问题也得到了关注,Google 推出的 Memory Provenance 框架增强了记忆的透明度和可控性,而 HuggingFace 的 SafeMemory 工具包通过差分隐私技术将隐私泄露的风险大幅度降低。这些技术突破使大模型的长期记忆能力得到了显著提升,推动了多个领域的应用发展。

2025 年,大模型的长期记忆技术将迎来新的发展趋势。如混合窗口架构或将成为上下文处理的新范式能够根据任务需求动态调整局部和全局注意力的范围,大幅度提升处理效率。随着多模态技术的进步,跨模态记忆融合将在视频、文本、触觉和嗅觉数据的编码上取得突破,进一步提升模型的记忆能力。记忆权限管理和记忆遗忘机制将更加成熟,为隐私和安全提供更强保障。

此外,随着用户对个性化和定制化的需求不断提升。个性化记忆系统能够根据用户的特定需求、偏好和行为习惯构建专属的记忆图谱。例如,AI 助手可以记住用户的兴趣、常用的命令、偏好的回答风格等,从而提供更加精准和符合需求的回复。2025 年,个性化记忆系统也将成为大模型发展的重点方向,大模型能够根据用户需求构建专属记忆图谱,提高个性化回复的准确性,并通过跨设备记忆同步实现实时更新。

不过,尽管大模型在长期记忆方面取得显著进展,但仍面临技术挑战,包括记忆冲突解决、多来源记忆的置信度评估体系、能耗瓶颈和认知偏差防控问题。商业应用方面,医疗、教育和金融等行业将受益于大模型长期记忆能力的提升,预计能够降低误诊率、提升知识留存率并加速风控响应速度。

趋势四:合成数据或加速大模型训练


随着人工智能技术的飞速发展,数据成为推动 AI 进步的核心资源。2025 年,合成数据作为加速大模型训练的一种重要方法,正在成为 AI 发展的关键趋势。马斯克在 2025 年 CES(消费电子展会)的访谈中提到,随着人类累积的知识几乎被 AI 训练完毕,未来的 AI 系统将不得不依赖合成数据进行自我生成和学习。这一观点突显了合成数据在未来 AI 技术发展中的潜力。

目前,多个科技巨头已经开始在 AI 模型训练中广泛应用合成数据。微软、Meta、OpenAI 和 Anthropic 等公司纷纷将合成数据作为增强模型训练效率和拓宽训练数据源的有效手段。例如,2024 年下半年发布的 Llama 3.1、o1、DeepSeekV3 和 Phi-4 等模型均报告了使用合成数据进行训练。根据科技市场研究机构 Gartner 的预测,到 2024 年,AI 及分析项目中使用的数据中,60% 以上将来自合成数据。合成数据能够帮助 AI 系统在真实数据难以获得或标注成本过高的情况下,生成具有代表性且符合特定任务需求的数据,大幅降低了对实际数据的依赖。

然而,合成数据的使用仍然面临诸多挑战与争议。2024 年 7 月,《Nature》期刊刊登的论文指出,LLM 生成的合成数据可能会污染下一代模型的训练集,导致模型性能下降,甚至发生“崩溃”。这一风险类似于“数据中毒”问题,严重时可能让模型无法做出有效的推理和判断。英伟达也发布了其 Nemotron-4 340B 开源模型,声称使用了 98% 的合成数据,但同时也强调需要加强合成数据的质量控制,以避免潜在的负面影响。

尽管面临风险,但合成数据在加速大模型训练方面的潜力仍然巨大。尤其在高性能计算和多模态数据融合等领域,合成数据可以快速扩展训练集的规模,并提供更多样化的训练情境。为了应对合成数据带来的挑战,AI 研究者正在不断优化生成数据的质量和多样性,例如通过强化学习算法对合成数据进行校正,或者结合人类监督和自动化评估机制来减少“数据污染”风险。

展望未来,随着技术的不断进步,合成数据有望成为 AI 训练中的重要组成部分。它不仅能加速模型的训练过程,还能在数据匮乏或难以获取的领域,为 AI 发展提供新的动力。

趋势五:大模型普及加速,效率跃迁曲线下成本更低了


在 2025 年 1 月,Anthropic 的 CEO-Dario Amodei 发表了一篇长达万字的深度分析报告。肯定了 DeepSeek 的技术突破:其最新模型在特定基准测试中已逼近美国顶尖水平,并尝试从三个维度将中国的 AI 进步纳入全球技术演进坐标系进行定位:算力规模定律、效率跃迁曲线、范式革新动能。

这些维度的选择反映了他对国产 AI 评估方面的理解:关注硬件和计算能力的提升(算力规模定律),技术的效率提升(效率跃迁曲线),以及新技术范式的创新和推动力(范式革新动能)。这种全方位的定位方式,能够精准捕捉到 AI 大模型在全球技术演进中的角色及潜力。具体我们解释下这三方面的重要性和趋势:

首先,规模定律是推动大模型发展的基础。随着硬件技术不断进步(如更强大的 GPU、TPU 和专用 AI 芯片),训练超大规模模型已变得越来越可行,同时也驱动了云计算和分布式计算的发展,进一步降低了成本。随着更强大的计算资源的普及和优化,规模定律将继续提升,这是 2025 年 AI 大模型的关键能力趋势之一。

其次,关于效率跃迁曲线,曲线偏移指的是技术创新带来成本曲线的变化,使得原本高昂的训练成本能够通过硬件优化、模型架构改进等手段大幅降低。这不仅能够降低 AI 研发的门槛,还能加速技术迭代。比如 2024 年,硬件创新如量子计算、专用 AI 加速芯片推动 AI 训练成本的快速降低。同时,AI 框架的优化(如更高效的深度学习框架)和算法改进帮助实现了更少计算资源的更高效训练。

在前文中我们也提到了,目前对于 AI 基础设施方面军备竞赛激烈,低成本做法渐成趋势,尤其是 DeepSeek 通过采用 OpenAI 等先进模型,利用蒸馏技术将其知识转移。这一过程使得 DeepSeek 能够在保持较高性能的同时,显著减少训练所需的计算资源和时间。通过模仿 OpenAI 模型的输出,“学生模型”能够快速学习复杂的模式和推理能力,加速模型的优化过程。2025 年,随着硬件和算法的进一步突破,AI 开发成本将大幅下降,这也使得更多的中小型企业可以进入 AI 领域。

此外,新的训练范式(如强化学习、无监督学习等)正在改变 AI 的学习方式。2020 到 2023 年,AI 主要依赖预训练模型,使用大量互联网文本进行训练,并通过少量额外训练进行微调。然而,到了 2024 年,强化学习(RL)成为新的重点,通过强化学习生成思维链,AI 在数学、编程和推理等任务上的表现显著提升。初期阶段投入较少,但效果显著。

强化学习和自监督学习等新兴范式逐渐在机器人、自动化和多模态学习领域得到应用,尤其提升了机器人在动态环境中的自主学习和决策能力。到 2025 年,这些新训练范式预计将成为 AI 发展的主流,尤其在复杂任务处理上(接下来趋势六我们会进一步解释)。

趋势六:预训练到后期训练和推理迁移转变


2024 年是 AI 技术飞速发展的一年,尤其是在大语言模型(LLM)和多模态技术方面取得了显著突破。这一年,AI 从单一模态向多模态融合迈进,大语言模型通过扩展上下文窗口和采用混合专家架构(MoE)等技术,显著提升了推理和生成能力。同时,强化学习(RL)开始与大语言模型结合,为模型的泛化能力提升提供了新的方向。此外,AI 在医疗、金融、自动驾驶等领域的应用不断深化,推动了行业变革。然而,随着模型规模的扩大,预训练阶段的性能提升逐渐放缓,行业开始探索后训练和推理迁移的新模式。

2025 年,AI 技术将进入一个新的发展阶段,Scaling Law 的扩展将成为关键趋势之一。强化学习与大语言模型的结合(RL+LLMs)将进一步推动模型泛化能力,从预训练向后训练和推理迁移转变。

这种模式将使 AI 在特定场景下的表现得到显著提升,同时降低训练成本,提高模型的适应性和灵活性。此外,AI 将在更多领域实现落地应用,如智能驾驶、具身智能等,这些领域将迎来技术突破和商业化的加速,但也与此同时会带来更多的安全和风险管理挑战。因此,AI 安全和治理将成为行业关注的重点。

需要强调的是,大规模语言模型(LLM)的预训练阶段已经接近瓶颈,主要受到数据、计算资源和模型规模增长的限制,且在通用性提升上边际效益递减。部分研究人员和行业专家担心,对于大规模语言模型而言,传统扩展方式已接近极限。生成式 AI 已遇瓶颈。据外媒报道,像 OpenAI 这样的公司在扩大技术应用时也发现困难重重,其他前沿实验室也面临更严重的挑战。知名数据科学家 Yam Peleg 透露,一些实验室试图通过延长训练时间和增加数据量来提升模型表现,但结果却遭遇了“收益递减墙”,且情况比公开报道的更为严重。

不过,尽管如此,预训练依然为模型奠定了基础,后续的优化潜力巨大。因此,在后训练阶段(如微调、强化学习、多模态对齐等)依然存在许多优化机会。通过领域特化、任务指令优化、模型压缩等技术,可以提升模型在特定任务上的表现,同时提高其在资源受限环境中的部署效率和安全性。

趋势七:更多优化算法将被用于强化学习等领域


目前,深度强化学习(DRL)的优化算法在多个行业取得了应用突破。为了解决传统强化学习在高维度问题上训练困难的问题,研究者采用了更加高效的算法,如模仿学习和分层强化学习,显著提升了模型的学习效率和训练速度。比如 Google DeepMind 推出的 AlphaDev 系统由两个核心组成部分构成:学习算法和表示函数。学习算法是在先进的 AlphaZero 算法基础上进行扩展,结合了深度强化学习 (DRL) 和随机搜索优化算法,以执行大规模的指令搜索任务。

此外,RLHF(强化学习与人类反馈结合)的应用开始更加深入和精细。AI 大模型开始通过更精确的人类反馈进行训练,从而能够更好地理解复杂任务,并且在人机交互中表现出更高的自适应能力。例如,OpenAI 的 ChatGPT 通过用户的实时反馈不断优化对话能力,以提供个性化和上下文相关的回答。由于 RLHF 能显著减少对大规模标注数据的依赖,更多 AI 系统开始通过少量高质量的人工反馈来进行高效训练,从而降低了模型开发和训练的成本。

还有近期处于话题焦点的 DeepSeek,R1 模型通过强化学习(RL)和基于人类反馈的强化学习(RLHF)进行训练,并针对核心算法模块做了大量的优化处理:比如改造 Attention 模块,通过低秩压缩,让 KV Cache 的效率达到最优。以及通过训练架构瘦身—例如 GRPO 算法通过省去传统强化学习中必须的 Critic 模型(即"双引擎"设计),将复杂算法简化为可落地执行的工程方案。一般传统的强化学习模型通常采用这双引擎”设计——Actor 和 Critic,Actor 负责执行决策,Critic 评估 Actor 的决策效果,二者需要同时进行训练,这增加了计算量和训练复杂度。通过去除 Critic 模型,GRPO 算法能够简化模型结构,降低计算资源的消耗。

随着 AI 应用场景的多样化,简化算法架构将成为 AI 发展的重要方向。2025 年,更多优化算法(如 GRPO 等)将被用于强化学习等领域,以减少计算资源的消耗,同时提高模型的执行效率和实时响应能力。

随着硬件资源的不断提升和算法的进一步优化,像 GRPO 这样的轻量级强化学习算法将被广泛应用于边缘计算和低资源设备上。例如,智能设备、物联网设备和机器人等领域,都会受益于这种简化的算法,实现在硬件条件有限的环境中高效运行。

趋势八:低成本训练与 AI 伦理,知识产权成为核心议题


春节期间,DeepSeek 的 DeepSeek-R1 震撼了全球科技圈和资本市场,其基于知识蒸馏技术,成功将大型复杂模型的知识迁移到较小模型,实现高效部署。2 月 6 日,斯坦福大学李飞飞团队和华盛顿大学研究人员以不到 50 美元云计算费用,成功蒸馏出一个名为 s1 的新推理模型,表现与 OpenAI 的 o1 和 DeepSeek 的 R1 相似,展示了蒸馏技术的强大潜力。基于竞争压力,2 月 7 日,OpenAI 公开了 o3-mini 的推理思维链,但该推理思维链并非原始数据,OpenAI 产品官 Kevin Weil 表示会找到平衡方式以避免被竞争对手蒸馏。

Kevin Weil 的考虑出发点在于,蒸馏通常依赖于将一个较大模型的知识提取出来,并将其迁移到一个更小的模型。如果目标模型能够有效地从源模型中获取有用的知识,且没有太大的性能损失,那么理论上,很多模型都可以通过蒸馏技术进行简化和优化。因此,随着 AI 蒸馏技术的普及,相关的法律和监管框架也需要不断加强,以确保在模型开发和应用过程中不会侵犯知识产权或数据隐私。

这种低成本训练的模式也引发了业界关于 AI 模型知识产权和伦理问题的讨论。随着越来越多的研究依赖于现有基座模型进行微调,是否应当给予这些基座模型开发者相应的回报成为一个重要议题。同时,如何确保 AI 技术的公平使用和共享,也亟待业界深入探讨和解决。


#04

下一个杀手级应用,可能在消费领域


趋势一:越来越多企业从人工智能上挣到钱


过去的 2024 年,是生成式 AI 的落地之年。而 2025 年,则是这些企业级 AI 应用在已有的落地场景中深入发展的一年。

美国风险投资机构 Menlo Ventures 在统计了 600 家美国企业的 IT 支出(包括模型支出、训练&部署支出、AI 应用支出,不包括芯片、云计算等支出)情况后发现,2024 年企业的 AI 相关支出达到了 138 亿美元,相比 2023 年的 23 亿美元增长了超过 6 倍。在这其中,应用支出的增速最快,6 亿美元增长到了 2024 年的 46 亿美元。

数据来源:Menlo Ventures

企业 AI 相关支出的提高,让不同的行业间接获益。第一个受益的是咨询公司。2024 年,埃森哲和 IBM 等咨询公司正在实现大幅的收入增长,其中,与人工智能相关的服务对其营收增长贡献显著,客户希望通过咨询,了解实施人工智能能够获得的竞争优势。根据埃森哲披露,截至 2024 年 9 月,其生成式人工智能咨询预订额近 30 亿美元。

第二个从人工智能中获益的行业是云计算和软件公司。软件公司 ServiceNow 自推出 “Now Assist” 以来,报告了强劲的生成式人工智能预订量,其首席财务官表示,在新产品系列中,最大新增年度合同价值贡献,来自于人工智能的采用。另外,软件巨头甲骨文的基础设施即服务(IaaS)部门实现了强劲增长,这在很大程度上归因于人工智能工作负载的增加。数据中心的领导者 Equinix 也因为人工智能基础设施需求获得了大量新合同。

另外,广告行业也从人工智能使用中获益。根据 Meta Platforms 最近报告,在人工智能的加持下,其广告展示量增长了 7% ,每广告的平均价格增长了 11%,季度收入同比增张了 19%。

亚马逊集成了基于生成式人工智能的产品图像生成工具,导致某些广告活动的广告展示量显著增加。我们预计,随着人工智能服务需求的扩大,具有独特市场定位、强大分销渠道和特权数据访问权限的云计算、软件应用和基础设施公司将成为主要受益者。随着人工智能市场的成熟,这些科技巨头可能在 2025 年实现加速增长。

我们尝试总结了生成式 AI 渗透率最高的几个应用场景:AI 代码、AI 客服支持和企业级搜索。

● 最高的是 AI 代码应用,企业对 AI 代码应用的采用率达到了 51%,比如,头部产品 Github Copilot 的 ARR(年度经常性收入,是指企业每年从客户那里获得的或期望从客户那里获得的服务或产品回报的收入计算)达到了 3 亿美金也真实的反应了用户的需求。Cursor、Cognition 等新兴工具在迎来用户快速增长的同时,也获得了资本市场的火热追捧。

● 其次是 AI 客户支持,其采用率达到了 31%,产品为内部员工或外部用户提供基于产品知识的客户支持。Sierra、Decagon 等初创借力生成式 AI 的智能,为用户提供符合品牌调性和消费者画像的定制化客服体验,挑战低效、无趣的传统客服。

● 第三是 AI 数据检索,其采用率达到了 28%,这类应用帮助企业解锁和利用分散在各组织中的数据,将数据孤岛中的宝贵知识管理利用。例如一家初创企业 Glean,其业务是企业级搜索,旨在为企业打造内部的 Google,核心产品 Glean Assistant 的用户每天平均查询 14 次,远超 Google 的日均查询次数。在过去一年 ARR(年经常性收入,Annual Recurring Revenue)达到了 5500 万美金。

数据来源:Menlo Ventures

2024 年,企业 60% 的 AI 应用支出来自企业创新业务的预算,说明企业使用这些应用的态度以尝试和探索为主,生成式 AI 在企业应用场景中的落地尚处于早期阶段。接下来,随着企业未来各个部门对于生成式 AI 应用的预算持续增长,哪些生成式 AI 应用能为企业带来实实在在的回报率,哪些或将分得持续性更长、规模更大的预算,从而支持生成式 AI 应用生根发芽、斩获 1 亿美金甚至更多 ARR。

①AI Agent 正在给企业带来效益


2025 年,生成式 AI 应用正在生根、发芽,给企业带来实实在在的现金回报,基于这样的趋势,AI Agent 将是这个商业环节闭环的关键。

AI Agent 从学术走向商业落地,仅花了三年时间。

AI Agent 的第一波高潮来自 2023 年年初,AutoGPT 的火爆,所谓 AutoGPT,其实是把学术圈很多的 Agent idea 简单呈现出来,尽管其让开发者感受到大模型的强大,但很快大家便发现,AutoGPT 的实验性强于实用性,难以解决大部分的实际问题。第二波高潮来自 2023 年 9 月,AgentGen,通过构建不同职能的 Agent,分工协作。

到了 2024 年,AI Agent 开始从实验走向现实。

2024 年末,OpenAI 首席执行官 Sam Altman 提出了 AGI(通用人工智能)的五层框架:

Lv1 - Chatbot,具备基础的对话能力,能够理解和回应简单的文本输入

Lv2 - Reasoner,具备基本的逻辑推理能力,能够分析复杂信息并进行推断

Lv3 - Agent,具备理解复杂指令的能力

Lv4 - Innovator,具备创新和创造的能力

Lv5 - Organizer,具备协调和管理庞大系统、资源和团队的能力

他提出,如今我们正处于第二个阶段并非常接近第三个阶段的状态。

Lv3 的 Agent 智能体能够自主与环境交互、收集信息,具备持续规划并执行多步骤、长时间任务的能力。要达成这个阶段,需要一个推理能力、逻辑能力更强的模型(可能是 o1 的下一个版本、也可能是对标 o1 的开源模型)。同时,服务AI Agent 应用的基础设施也必不可少。

当下,企业出于安全性、准确性、稳定性等因素的考量,更倾向于使用 AI Copilot (人在回路中参与)增加人在工作流中的效率,而不是直接采用端到端自动化 AI Agent。随着底层模型能力和 Agent 框架开发的持续升级,Agent 应用将为企业提供更智能高效的数字员工。人与 AI 的协作关系将从 AI 赋能人工作,逐渐转变到人监督指导 AI 完成工作,最终达到 AI 自主完成工作。这个转变会在未来几年迅速发生。

至于适合AI Agent 最先产生价值的应用场景,2025 年大概将延续现阶段生成式 AI 渗透率高的场景,例如代码编程、客服、销售、营销等。

根据第三方机构 Menlo Ventures 的调查数据显示,企业内各部门的生成式 AI 预算划分中,IT 部分独占鳌头(22%)、产品和工程开发次之(19%),客服(9%)、销售(8%)和营销(7%)紧随其后。
 
数据来源:Menlo Ventures, UpHonest Capital

根据硅兔赛跑的观察,一些企业的确正在从这几个场景中赚钱:

IT 部门选择之一的初创公司 Glean,在 2024 年 9 月份完成新一轮融资,估值达到 46 亿美元,其旨在优化企业内部数据检索和问题答复。

在产品和工程开发部门依赖的 AI 编程应用中,初创公司 Cognition 在 2024 年 3 月推出了首个 AI 程序员Devin,成立仅 6 个月就达到了 20 亿美金估值。同年 12 月其 Agent 产品 Devin 正式上线,区别于普通的代码补全应用,Devin 能够无需人类参与进行自主编码,完成需要人类工程师参与的项目开发。目前 Devin 拥有诸多头部客户:例如 Ramp 使用 Devin 编写测试代码并清理死亡代码,MongoDB 使用 Devin 更新过时的代码架构。

硅谷投资机构 UpHonest Capital 早期投资的 Cosine,正在打造全自动的AI 软件开发助理Genie,曾在 SWE-Bench 测试中获得全球最高分数。Cosine 研发了独有的数据管道,能够生成具有人类工程师开发逻辑、增量知识、支持搜索的高质量数据集。同时,Cosine 是 OpenAI 最大的模型微调合作伙伴,拥有其前沿模型的早期使用权限。结合数据和模型优势,Cosine 已经与多家世界 500 强公司和明星初创公司达成合作。

客服作为人力密集型工作,也将成为 AI Agent 最先颠覆的环节。比如 UpHonest Capital 早期投资的 Proactive AI 正在为零售品牌打造具有高情感智能语言能力的客服助理,主要帮助企业向其用户提供契合品牌调性和个性化需求的客服服务,目前已与餐饮、健身、沙龙等行业多家头部企业达成深度合作。
销售和营销作为企业开源的重要入口,企业利用最新技术提高获客效率的意愿也非常高。美国的人工智能初创公司 11x,打造 AI 驱动的“数字工作者”以取代传统的销售团队,其 Agent 能够自主执行 GTM 工作流程。11x 不通过软件帮助企业降本增效,而是直接提供实在的工作成果,数字员工能够自主实现完成的收入闭环。11x 成立 6 个月就达到了 200 万美金的 ARR,目前 ARR 已经达到了 1,000 万美金。FlashIntel 正在打造 AI 驱动的 GTM 平台并向企业提供 AI 驱动的销售助理(SDR)。FlashIntel 在 G2 2024 冬季报告中总计获得了 189 枚徽章,其中 FlashRev 被评为最佳销售产品,最佳营销和数字广告产品,以及最高满意度产品。

② 在数字化渗透率低的传统行业有隐藏的“金矿”


曾经,传统行业的玩家对 AI 嗤之以鼻,过高的投入成本和微不足道的效果,让他们难以对 AI 押注过多。

不过这一次,传统行业的生成式 AI 之路,有可能跳过软件阶段,直接进入 AI 阶段,类似新兴市场从使用现金直接转向移动支付。

这些行业本身对于科技的采用速度较慢,生成式 AI 的出现带来了直接交付结果而非交付软件的模式,减少了前期投入成本、肉眼可见的提升了投资回报率,使得恐惧新技术的决策者更容易被说服。比如医疗领域的病例记录、法律领域的案件报告生成、金融行业的合规风险筛查等等。

2024 年 12 月,美国家政垂直软件巨头 ServiceTitan 上市,上市当天股价涨幅超过 40%,在 2024 年上市公司中,该涨幅仅次于社交平台 Reddit 和芯片公司 Astera Labs 两家。

要知道,ServiceTitan 2012 年成立,历经 12 年发展,在仅拿下家政行业 1% 市场份额的情况下,其市值一度达到 90 亿美元。由此可见,美国垂直行业,数字化渗透速率之低,垂直行业 AI 化的价值之高。ServiceTitan 之成功,自然使我们关注到美国传统行业的机会,数字化渗透率低的传统行业。

美国初创公司 Sameday 为美国家庭服务行业(除虫、HVAC、家庭维修等)提供 AI 销售代理,通过自动化的语音客服接听来电并安排服务预约,提高电话接听率,从而提高转换率,现在已经与 ServiceTitan 集成。Sameday 的创始人曾在美国增长最快的家庭服务行头部公司担任 CMO,拥有极深的行业认知和丰富的行业资源。2024 年,Sameday 的 ARR 预计将增长 5 倍以上,月度客户留存率达 98.5%。

建筑行业的 AI 解决方案提供商 Pantheon,能够生成高精度且可编辑的 3D 建筑模型,通过 AI 实现更快的设计迭代周期可以显著降低项目成本。Pantheon AI 不向建筑师出售软件许可证,而是直接向房地产开发商和业主出售其设计服务。2024 年 10 月,Pantheon AI 完成了由 a16z 领投的 2500 万美金种子轮融资。

传统行业以外,法律、金融、医疗行业积累了大量数据,为行业垂直基石模型训练提供了丰富的燃料,且法律、金融、医疗行业价值高,但普遍在传统软件巨头的垄断下变化缓慢。即便垂直 SaaS 一定程度上取代了过时繁琐的老系统,但总体的渗透率依然有限。以医疗行业为例,其行业规模高达 4.3 万亿美元,贡献了约 1/5 的美国 GDP。但在美国市值前 100 的上市软件公司中,只有一家是服务医疗行业的软件公司。

2024 年,Evenup ARR 预计将达到 5000 万美金,最新一轮的投后估值达到了 10 亿美金。Evenup 利用生成式 AI 帮助律师进行人身损害赔偿(Personal Injury Claims)案件的索赔工作。虽然目前只服务于人身损害赔偿这一个领域,但这已经是一个非常大的市场了。美国每年约有 30 万参与处理人身损害赔偿的律师,每年支付给受害者的索赔金额高达 1000 亿美金。

有备而来者,率先享受红利,那些垂直行业专家、对行业的工作流有深入认知的创业者,结合不断进化的生成式 AI 基础设施,有机会迅速抢占用户,构建自身的行业数据壁垒。

③ AI 不再按席位收费 :“Sell work, not software”


Menlo Ventures 的调查数据显示,企业在进行生成式 AI 产品采购决策时,第一考虑要素是产品是否具有简单可测量的投资回报率,其次是产品是否根据实际应用场景定制。

值得注意的是,现阶段,产品价格反而是最不重要的影响因素,仅 1% 的企业决策者声称产品价格影响采购决策。
 
数据来源:Menlo Ventures

结果正在变得更为重要。随着 AI 的独立工作能力提升,其工作结果、创造的价值会更容易被量化,企业对 AI 产品的价值评估,也会根据其工作成果界定,美国投资机构 a16z 提出。因此,商业模式变得更加重要。

SaaS 时代,SaaS 公司创新了按席位收费的商业模式,即按照使用 SaaS 产品的员工账号数量按月或按年收取订阅费用,这种定价方式背后的逻辑是,使用 SaaS 产品的每位员工,效率会有不同程度的提升、处理更多工作,许多 SaaS 定价的策略在于评估使用者效率提升创造的收益。

但到了生成式 AI 时代,这个 SaaS 时代一直以来赖以生存的逻辑正在被颠覆。随着 Copilot 产品向 Agent 产品的升级,未来的 Agentic AI 系统将在不同 AI agents 的相互配合下,自动完成任务,取代越来越多的工作者,显然,如果继续按照席位收费,开发者的收入则会逐渐减少。

Benchmark 合伙人最先建议生成式 AI 公司“Sell work, not software”,即按照工作成果收费,打破按席位收费的模式。

基于此,目前原生 AI 公司普遍采取的商业模式分为两类,一类是基于用量的定价模式,Salesforce 发布的 Agent force 智能体系统,提供客服、销售、员工服务等 AI agent 智能体,按照用户与 agent 实际交互的用量收费,每次”对话“收费 2 美元,如果发生以下三种情况之一,即视为一次”对话“结束—— AI agent 无法满足用户需求,需要人工介入;用户主动结束与 AI agent 对话;用户超过 24 小时没有再主动与 AI agent 对话。

另一类是基于工作结果的定价模式,前 Salesforce 联席 CEO Bret Taylor 创立的 AI 客服公司 Sierra,为客户提供基于工作结果收费的客服 AI agent,从消费者满意度、问题解决程度、以及每次的交互成本三方面来评估工作结果,决定企业付费规模。采用按照工作结果定价的模式,实现了 AI agent 企业客户与开发公司的利益一致性,双方将共同得益于 agent 独立任务完成能力的提升。

趋势二:等待一个“杀手级”AI 消费级应用


“2025 年(AI 应用)下一个大事件属于消费。”美国红杉资本合伙人 Jess Lee 表示,AI 聊天、图片、视频已验证了其消费市场潜力,接下来将看到全新的 AI 消费社交 APP、新形式的互动媒体、基于聊天的游戏、新的搜索和信息整合工具、基于互动式 UI 的聊天工具等。”

消费赛道,一直是历次技术创新浪潮下创业者和投资人高度关注的方向,如果回顾之前的技术周期会发现,全球市值 Top15 的科技公司中,有 9 家是从 To C 消费产品起家的。To C 的公司上市时,估值超过 100 亿美元的比例,比 To B 公司高 10% 左右。

但在这一波生成式 AI 创业浪潮中,消费 AI 应用似乎在被创业者和资本遗忘。2024 年,90% 以上的 A 轮融资流向 AI 企业应用。

不过,自 2024 年下半年以来,这个现象正在发生改变。

2024 下半年以来,资本市场对消费级 AI 应用的关注度上升,以硅谷孵化器 Y Combinator 为例,其下半年孵化的消费级 AI 产品数量比上半年翻番。
 
数据来源:Y Combinator, UpHonest Capital 整理

2025 年,消费级 AI 应用的“土地”正在被开垦,行业在等待一个“杀手级”AI 消费的应用。风险投资机构也对消费级 AI 应用的机会产生共识。YC Partner Michael Seibel 表示,目前太多创始人寻找 B2B 的 AI 机会,太少人探索消费侧的机会,消费创业者的机会来了;a16z 提出“生成式 AI 或将重塑从旅游、心理治疗到网购等一切(消费行为)。“前 Index Ventures 合伙人 Rex Woodbury,称现在是“消费复兴”的机会。

生成式 AI 对消费端改变,体现在三个层面:首先,AI 会逐渐改变人与人、人与信息交互的方式,形成新的流量入口;其次,AI 搜索正在改变信息的分发方式,会创造新的商业机会;第三,AI 释放 PGC、UGC 内容创作潜力,使内容消费更加丰富多元。

以 AI 搜索为例,作为线上流量的第一入口,已经久无战事,生成式 AI 引入了新变量。2020 年创立的生成式 AI 搜索初创 You.com,近期完成 5000 万美元融资,价值 7 亿美元了。OpenAI 在 7 月发布 AI 搜索工具 SearchGPT,其付费用户均可使用。

Perplexity 是一家成立于 2022 年 8 月的美国 AI 创业公司,公司由前 OpenAI 研究科学家 Aravind Srinivas 和前 Meta 研究科学家 Denis Yarats 等联合创立,专注于开发基于人工智能的对话式搜索引擎,旨在通过大型语言模型(如 GPT-4 和 LLama2)为用户提供精准的搜索结果。Perplexity 的界面更像是聊天屏幕,用户可以通过自然语言提问,Perplexity 会提供直接的答案,并附上详细的引用来源,Perplexity 的用户增长非常迅速。2023 年 2 月,Perplexity 的月访问量达到 1000 万,独立访客达到 200 万人。截至 2024 年 4 月,Perplexity 的月活跃用户数便突破了 1500 万。Perplexity 在短时间内完成了多轮融资。截至 2024 年 11 月,Perplexity 在新一轮融资中筹集了 5 亿美元,使公司估值达到 90 亿美元。投资方包括软银、亚马逊创始人贝索斯和英伟达等多家知名企业和 AI 领域知名人士。

除了通用搜索引擎,生成式 AI 使垂直领域的搜索引擎更普遍,瓜分通用搜索引擎的注意力。例如,垂直于企业知识数据库的搜索——Glean 在 9 月份完成新一轮融资,估值达到 46 亿美元,旨在优化企业内部数据检索和问题答复,在近两年中 ARR 翻倍增长;亚马逊、沃尔玛都在加强电商搜索引擎建设,今年先发搜索助手,再发 Agent。初创企业 DayDream 种子轮拿到了 5000 万美元投资,Forerunner、Index 联合领投。DayDream 链接了超过 2000+ 品牌,支持自然语言检索,根据用户提供的时间、地点、场合等信息给予相关产品推荐。Encore,YC24 新一期孵化项目,是一个 LLM 驱动的针对二手商品购物的搜索引擎,链接美国多个二手商品网站,支持自然语言搜索以及按照主题的搜索;垂直于科研场景的搜索:初创企业 Consensus 与 Perplexity 有共同的投资人 Nat Friedman 和 Daniel Gross,专注打造服务科研的搜索引擎,改变人们获取和使用学术文献的方式。2024 年收入增长了 600%,月活 40 万用户,ARR 近 200 万美元。

也许明年会出现更多令人眼前一亮的垂直领域的 AI 搜索创新。

这一点,美国红杉在 2025 年的 AI 趋势预测中也分享了一些思考,红杉提出 AI 搜索或将成为 2025 年的”杀手级“应用,他们提出了两点预测:目前一个整体的搜索市场可能会碎片化,未来每个人可能会有专业 AI 搜索引擎——例如,Perplexity 可能会成为投资人和分析师的第一搜索工具选择,律师选择 Harvey,医生选择 OpenEvidence……全新的生成式 AI 搜索引擎将紧密契合目标用户的“心智模式”,投资人、律师、医生的思维模式各不相同,信息获取模式、目的和决策思维各有差异,这些不同和差异就是生成式 AI 搜索引擎创新的机会;消费级和企业级应用场景分化,每位知识工作者每天至少会使用两款 AI 搜索引擎 —— 一款用于工作,另一款用于其他所有事务。

除了 AI 搜索,落到电商、音乐、社交、游戏、旅行和教育等直接 To C 的领域中,也各有生成式 AI 原生应用的创新机会。

以旅行为例,Wanderboat 是面向消费者的 AI 旅行规划工具,也是旅游内容分享社区。它构建了一个 chatbot,可以根据用户需求推荐、定制目的地及各类娱乐体验活动,还可以主动学习用户的兴趣,定制专属行程。基于创始人此前在微软的经验,构建了一些很有趣的小工具,比如用户在查看地图时也可以与 AI 互动,实时获取一些信息和建议。在零付费推广的情况下,月活用户数量达到了 6 位数。

一是多模态 AI 营销,从文字延展到音频、视频。形式从单点的 chatbot 延展到具有操作执行能力的 agent,并且准确率和对于边缘案例的覆盖力随着基石模型推理能力的提升增强。此外,如果生成式 AI 运用得当,销售、营销、客服对消费者的洞察进一步提高,可以创造更加个性化的服务、定制化体验。

GigaML 是 YC 孵化的一家 AI 客服初创,虽然这个方向竞争激励,但实际 GenAI 应用的渗透率还比较低,因为客服在实际工作中有许多边缘案例,现在大部分的 GenAI 应用解决边缘案例的表现一般,原有的自动化客服足以解决基础问题,所以企业升级的动力不足。GigaML 发现将基石模型切换至 o1-preview,加上大量的评估、调优之后,错误率大幅下降,从 70% 降至 5%,并能够解决 8 成的边缘案例。在 OpenAI 最新推理模型加持下,客服用例值得期待。

Para 和 HeyGen 分别是声音和视频营销的典型案例,Para 利用 AI 生成个性化定制的声音营销电话,帮助品牌激活用户,帮助球队活跃粉丝;HeyGen 的 AI 视频营销收入快速增长,据悉今年的年化 ARR 超过 2000 万美元,估值已达到 5 亿美元。

AdsGency 则是一个利用 AI 用户数据洞察,实现精准广告营销的公司,创始人此前曾在滴滴、亚马逊从事广告、营销相关的产品工作。它的业务核心是广告和用户数据,为客户提供了一个全栈 AI 营销工具,覆盖内容创意、创作、投放、归因等流程。AdsGency 也代表了现在 AI 营销的一个发展趋势—— 从 Point Solution,到整个 GTM 的全流程自动化解决方案。

趋势三:企业应用大模型朝模块化方向发展


2024 年,人工智能领域的一个显著趋势是模型的可组合性和模块化发展,这种模块化实现了从概念到规模化地落地。企业不再仅依赖于单一的“大模型”解决方案,而是可以根据具体需求,将不同的模块进行组合,定制出符合自己业务需求的能力。这种灵活性不仅能够提升效率,还能降低成本,并且更好地满足各行业对 AI 应用的多样化需求。

在技术架构层面,传统“大一统”的大模型被逐步拆解为功能与场景模块,例如 Amazon Bedrock 提供了一系列生成 AI 的模块化服务,涵盖文本生成、图像生成、语音合成等功能,这些模块化的服务可以帮助企业根据自己的需求进行定制,支持跨行业的 AI 应用,如生成个性化的营销文案、产品推荐和自动化客服对话等服务。微软推出了更加精细化的模块化 API,支持更加多样化的场景,例如多语言客服、智能会议助手和自动化客户反馈系统。Transformer 论文八位作者之一 Aidan Gomez 也瞄准这一方向,估值 55 亿美元的 Cohere 提供专为企业用例优化的系列 AI 模型,在语言生成、多语言处理、多模态、语义检索等方面各有所长,企业按需选择、组合。

2025 年,模块化和抽象化设计将在多个领域得到广泛应用,特别是在人工智能和机器学习领域。这种设计方式将推动 AI 系统的高效演化和自适应能力,为 AI 技术的广泛应用提供更强大的支持。根据 Gartner 预测,到 2028 年,至少 15% 的日常工作决策将通过代理 AI 自主做出。

这种趋势表明,模块化和抽象化设计将为 AI 系统的自主决策提供更强大的支持,推动 AI 技术的广泛应用。并且,更多的技术企业将推出专为行业需求定制的 AI 模块。例如,针对智能制造、智慧医疗、自动驾驶等领域的具体需求,可能会出现更加精细化的模块组合,企业可根据自己的数据和业务需求灵活选择。而且随着硬件能力的提升,这些模块可能会更加高效,甚至实现更高的跨领域协同能力。总之,这种模块化大模型的发展将向纵深推进,技术、商业与社会的多重博弈将重塑行业格局。


#05

总结


这场科技商业史上最大“赌局”,让身处其中的投资者越来越感受到了曾经硅谷早期的投资氛围——押注一个未知的全新技术、等待一个超长回报周期,而不是基于互联网成熟技术的模式创新上迅速迭代和回血。
 
自从 ChatGPT 发布之后,硅谷正在吸引全球的目光。关注硅谷发生的故事,正在成为众多的中国投资者甚至中国企业员工、公关必做的事,大家试图从这些持续关注中获得最前沿的信息和生成式 AI 最前线所发生的故事,从而试图判断新的商业方向。
 
谁也不知道这场生成式 AI 的变革会将商业引向何方,也同样预测不到新技术的迭代如此之快。
 
在过去的几年里,听到最多的便是企业对生成式 AI 的抱怨“我们知道它重要,但我们仍然不知道如何用在自己的场景中”,这种抱怨带着一些敬畏——“不上大模型一定会被淘汰”。投资者在不断推高的估值和融资中,快要丧失信心。动辄几十亿美金的融资,再加上 Scaling Law 之下,不断增加的数据中心的投资,让他们望而却步。这也表明,2025 年将是生成式 AI 让人们看到赚钱希望的一年,投资者和创业者同样需要信心。
 
AI Agent 元年,这个发端于学术界的概念将会落到实际,并产生价值,企业将会使得生成式 AI 变得更加好用,并切实转化为价值。与此同时,消费级的 AI 应用将会让人们切实感受到生成式 AI 带来的生活的变化。
 
垂直领域的模型正在成为通用大模型的补充,让更多企业释放 AI 的价值。垂直行业中,将会出现越来越多的 AI 搜索应用,满足人们不同领域的需求。
 
2025 年,从生成式 AI 来说,一些泡沫会破灭,一些企业能够从中赚到钱。技术新陈代谢快速而残酷,这场竞争中没有老手,都是新人,昔日的领军者亦有可能跌落神坛,最先关注到技术和商业的变化,并做出行动的企业,才能在这场竞争中生存下来。

*【免责声明】本篇内容并非投资意见,为便于理解,该报告汇总了相关领域的典型企业案例作为参考,但所含相关公司资料不构成任何投资产品之要约或者建议,只作为一般参考资料用途。

文末互动:
你对这份报告的哪个部分最有兴趣?
评论区告诉我们你的看法哦~


 别忘了点关注,不迷路啊。
👇👇👇

川普“登基”加密变天!独家对话一线从业者,一文看尽 Web3 众生相

Get Rich

点赞 + 在看,搞钱稳赚!


【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

硅兔赛跑
数据请求中
查看更多

推荐专栏

数据请求中
在 App 打开