DeepSeek 荣光下：落寞的“六小龙”

TTPRO1562104-2-sr_x2.0.png 图片来源：由无界 AI 生成

人类的悲欢并不相通。从 2016 年开启的人工智能元年，AI 产业已经历好几轮洗牌，借着 ChatGPT 的东风，DeepSeek 如同鲇鱼一般搅动了整个大模型市场，同为大模型创业公司并被业界视为新贵“六小龙”的厂商们，与其相比，境遇堪称东边日出西边雨。

DeepSeek 年前推出低成本、性能媲美 GPT-4o 的 DeepSeek-V3 震惊业界后，其接着在 1 月 20 日发布 R1 模型，上线六天后登顶苹果 App Store 全球下载榜首，上线一个月累计下载量超 1.1 亿次。在这期间各大云厂商迅速上线开源版 V3 和 R1，百度搜索、微信等产品都在积极拥抱 DeepSeek。

而和 DeepSeek 同时期发布的 Kimi 全球强化学习模型 k1.5、阶跃推理模型 Step R-mini，在模型能力上诸多层面接近 o1，但依然淹没在了 DeepSeek 火爆的舆论中。

与 DeepSeek 的喧闹相比，“六小龙”也是接二连三的爆出消息：零一万物进一步拆分、月之暗面缩减投放预算和仲裁案未和解、MIniMax 又一高管离职……

而这背后还有失意的 VC 们：真金白银支持的项目，没有一个达到 DeepSeek 这样的热度。目前，“六小龙”中已经 4 家超半年没有融资消息释放。2024 年业界称“六小龙”中已有两家掉队，2025 年，下一个掉队的是谁？

只剩三家继续扎根大模型

DeepSeek 的爆火并非没有征兆，自 2023 年 11 月 2 日推出首个模型 DeepSeek Coder 后，一年多时间上线了超 10 个不同版本的模型。其中去年 5 月发布的 V2 模型，性能上比肩 GPT-4 Turbo，价格却只有 GPT-4 的 1%，因此 DeepSeek 被称作“价格屠夫”“AI 界拼多多”，同时掀起了大模型行业的第一轮价格战。

2025 年 1 月 27 日 DeepSeek 超越 ChatGPT，登顶中国区和美国区苹果 APP Store 免费榜，引发全球关注。让 DeepSeek 有如此成就的是其推理大模型 DeepSeek-R1。根据 DeepSeek 公布的信息，R1 在多项权威测试中得分与 o1 正式版接近，部分测试中得分还超过 o1 正式版。

榜单评分外，开源 + 性价比则是让 DeepSeek 引发泼天热度的重要组合拳。受到 DeepSeek 的冲击，曾经的闭源信徒百度创始人李彦宏也宣布加入开源队伍，OpenAI 创始人山姆.奥特曼也反思道，公司在开源领域的策略上一直处于“错误的一方”。

大模型“六小龙”中的 MiniMax 在 1 月 15 日发布了首个开源模型，其创始人闫俊杰在接受《晚点》采访时也表示，“第一次创业很多经验不具备，如果可以重新选，应该第一天就开源。”其他五小龙中，只有智谱是最早开源闭源两条腿走路的。经过近两年的摸爬滚打后，“六小龙”发展方向已南辕北辙。

零一万物是第一家公开大幅调整的基础大模型公司，先是裁撤了预训练算法团队和 Infra 团队，部分人员以跳槽形式加入阿里，后宣布与阿里云、苏州高新区分别联合成立产业大模型联合实验室、产业大模型基地。

人员方面，模型训练负责人黄文灏、负责大模型 API 开放平台的蓝雨川、生产力产品负责人曹大鹏都相继离职。试图留在牌桌上的零一万物，掩盖不住在这一轮大模型竞赛中的颓势。

百川智能则在 2024 年明确了走医疗赛道，近期上线了首个“AI 儿科医生”。在 To B 的商业化上百川则似乎不太顺利，其联合创始人、商业化负责人洪涛年前已经离职。据百川一位员工告知的确不及预期，“现在有了 DeepSeek 后，今年的压力只增不减。”

To B 商业化负责人离职的还有 MiniMax 的魏伟，此前魏伟接受采访时表示，很多 B 端客户不会轻易掏这个钱，去支撑大模型公司的营收，只能基于研发能力、算法能力来帮助客户在实际场景中对齐输出效果，也印证了大模型商业化并非易事。

如此看来，仍在专注于大模型技术创新和追求 AGI 的，仅剩下月之暗面、智谱、阶跃星辰。受到 DeepSeek 的影响，阶跃星辰也加入了开源阵营，只是与 DeepSeek 重点在文本模型上不同的是，阶跃星辰最新开源的是两款多模态模型——Step-Video-T2V、Step-Audio。

2 月 23 日凌晨，月之暗面发布最新论文《Muon is Scalable for LLM Training》，并开源 MoE 模型 Moonlight，模型激活参数仅需 3B。不少业内人士认为这是在“截胡开源周”，因为早前 DeepSeek 宣布将连续 5 天发布开源项目。

对月之暗面而言，火烧眉毛的或许是其大手笔投流的 Kimi 产品。

烧钱投流难成榜一大哥

与大模型“六小龙”一样 DeepSeek 也有同名 C 端产品，在上线后的第一周并没有在市场上引起过多的关注。据 QuestMobile 向媒体披露的数据显示，2025 年 1 月 13 日至 1 月 19 日，DeepSeek App 周下载量仅为 28.5 万，远不及豆包（452 万）以及 Kimi（155.7 万）。

在 2025 年 1 月 20 日 R1 发布后，DeepSeek 下载量开始陡峭式增长，Sensor Tower 研究显示 DeepSeek 在发布会 18 天内下载量超 1600 万次，几乎是 OpenAI 的 ChatGPT 首次发布时的 900 万次的两倍。

访问量激增，一度让 DeepSeek 闪崩，而即便如此，增长的势头依然很猛，月下载量超 1.1 亿。DeepSeek 的光芒再也没有哪家可以视而不见，2 月 13 日字节跳动内部全员会上，CEO 梁汝波谈及 DeepSeek 时，反思跟进速度不够，今年要追求智能上线。

腾讯的微信灰度测试接入了 DeepSeek 的 AI 搜索，在使用量超预期后又调用了 AI 应用元宝支持微信搜索。2 月 22 日，腾讯元宝超越字节的豆包，升至中国区苹果免费 APP 下载排行榜第二，DeepSeek 继续位居榜首。

“榜一榜二大哥”在短短一个月内易主，迫使烧钱换增长的豆包和 Kimi 优势不再。两者的区别是，前者是含着“金钥匙”出生的贵族，后者则是“创业新贵”。此前有媒体测算，仅在 iPhone 渠道，Kimi 每天的投放金额接近 20 万，豆包则为 248 万。

在 DeepSeek 的影响下，月之暗面近期被爆大幅削减产品投放预算，包括暂停多个安卓渠道的投放，以及第三方广告平台的合作。据内部人士向《AI 光年》透露，推广确实做了相应调整，“有自然新增，但无法和 DeepSeek 的涨势相比。”

kimi 当下的烦恼可不止这些：「暗涌 Waves」独家获悉，搁置颇久的 Kimi 仲裁案，并未和设想的一样，完成和解，而是进入到仲裁案的下一流程中。据知情人透露：Kimi 仲裁案的双方，循环智能老股东和杨植麟等，已分别于 1 月底和 2 月下旬，在 HKIAC（香港国际仲裁中心）完成缴费，目前组庭也已完成。而整个事件背后更关键的主角张予彤，或将被另外单独提起诉讼。

对 To C 产品同样予以厚望的还有 MiniMax，原因是其旗下明星产品 Talkie2024 年上半年成为美国下载量第四的 AI 应用，使之吃到了甜头。但好景不长，12 月中旬 Talkie 在美国市场的苹果应用商店中悄然消失，而安卓平台则未受影响。

阶跃星辰、零一万物、智谱 AI 和百川智能也都有自家的 AI 应用产品，但根据 AI 产品榜显示 2025 年 1 月，月活前 20 的 AI 应用中没有一家是与这四家厂商相关的。此前百川智能的员工告诉《AI 光年》，“百小应的用户留存和增长很差也不意外，我们基本不做广告投放，先让其他家烧钱完成用户教育。”

目前 DeepSeek、腾讯元宝、字节豆包霸占了苹果免费 APP 下载排行榜前三。大模型“六小龙”想要上榜，竞争只会更激烈，目前排名第七的纳米搜索，周鸿祎正在亲自下场“带货”。

另外还有一个不容忽视的对手就是阿里，AI 应用通义并入阿里智能信息事业群后，近期阿里 AI To C 业务开启了大规模招聘，岗位达数百个，集中在 AI 大模型相关的产品、技术研发岗位。前有狼后有虎，正是大模型“六小龙”当下处境的真实写照。

当技术故事不再浪漫、商业化不及预期、产品月活用户增长与投入不成正比，大模型“六小龙”理想丰满，现实骨感。

下一轮融资门槛提高

大模型预训练烧钱是公认的事实，李开复曾透露，一次预训练成本约三四百万美元，即便是成本更低的 Yi-Lightning，在训练时也用了 2000 张 GPU，耗时一个半月，花费三百多万美元。

即便标榜低成本的 DeepSeek，在前期的投入也是难以估量的，第三方机构 SemiAnalysis 推算，DeepSeek 实际拥有庞大的算力储备：共堆砌了 6 万张英伟达 GPU 卡，其中包括 1 万张 A100、1 万张 H100、1 万张“特供版”H800 以及 3 万张“特供版”H20。

“通用大模型的训练成本，我们预估的大概 10 亿美金左右，这仅仅是算力部分，还没算另外两个很花钱的部分，一个是数据，一个是人力成本，现在全球大模型领域的人才，是非常稀缺的。”将门创投创始合伙人、前微软创投大中华区负责人杜枫博士曾告诉作者。

由于需要如此高昂的投入，导致很长一段时间里业内流行一种说法：投资大模型企业的入场券是 1 亿美金。这句话背后的另外一个信号是，一个大模型创业公司拿不到融资，是难以活下去的。

2023 年百模大战掀起后，几乎每隔一个月都会有融资消息释放出来，但随着 AI 泡沫论甚嚣尘上，2024 年 9 月起，很长一段时间没有数亿级的热钱流向大模型“六小龙”。直到 2025 年春节前，智谱和阶跃星辰先后宣布拿到了“过冬钱”，前者宣布完成新一轮 30 亿元人民币融资，后者则完成 B 轮数亿美元融资。

“六小龙”中另外 4 家已经距离上一次融资动态发布有超半年：MiniMax 去年 3 月官宣完成 6 亿美元 B 轮融资、百川智能去年 7 月获得 50 亿元 A 轮融资、零一万物去年 8 月完成新一轮数亿美元融资、月之暗面去年 8 月完成 3 亿美元融资。

春节期间，DeepSeek 火爆全球，舆论毫不吝啬夸奖 DeepSeek 及其创始人梁文峰。在创投圈关于 DeepSeek 会不会开启融资、估值多少，近日一直有不少消息流传出来。

此前有消息称阿里将以 100 亿美元估值，投资 10 亿美元占股 10%。对此阿里副总裁颜乔很快通过朋友圈辟谣称，“外界流传阿里投资 DeepSeek 的信息是假消息”。而后外媒称“DeepSeek 首次考虑筹集外部资金”，DeepSeek 相关人士辟谣，融资消息均为谣言。

“不少投资人都直接或者托关系在约梁文峰，我预测估值应该是远超于目前‘大模型六小龙’的。”中金资本一位投资人表示，“DeepSeek 成为了对标对象，六小龙要在一级市场拿到新融资，门槛显然更高了。”

事实上，自大模型创业潮掀起以来，行业内普遍不太相信“六小龙”最后都能作为独立“大模型公司”生存下来的。“六小龙”中几位创始人也在公开场合表达过类似的观点，比如 MiniMax 创始人闫俊杰认为未来全球只会剩下 5 家大模型企业。

“中国一定会有自己的 ChatGPT。这跟搜索引擎一样，我们有自己的合规要求。但是中国版的 ChatGPT 只会在 5 家公司里产生：BAT+ 字节 + 华为。”迅雷创始人、远望资本程浩曾告诉作者。

持续爆火下，本就走向分化的“六小龙”将加速洗牌。

中国 AIGC 产业应用峰会回顾

2024 年 1 月 5 日，【智求共赢・中国 AIGC 产业应用峰会暨无界 AI 生态合作伙伴大会】在杭州未来科技城会议中心举行。

大会汇集行业资深专家及领军企业，共同聚焦 AIGC 领域，围绕当下热点话题进行深度延展，探讨行业激烈竞争下的运营新思路、发展新模式！点击文章，回顾精彩内容~

AI 新智界园区开放合作啦！

据 BleepingComputer 报道，安全公司 ThreatFabric 旗下研究人员表示，新型恶意软件 Crocodilus 可窃取安卓用户的钱包助记词。该恶意软件通过专有的驱动程序传播，并绕过了 Android 13（及更高版本）的安全保护，用户安装恶意软件时不会触发 Play Protect。其通过屏幕叠加警告用户「在 12 小时内备份设置中的钱包助记词」，否则就有可能失去对钱包的访问权限。「有了这些信息，攻击者就可以完全控制钱包并将其完全耗尽。」

推荐专栏