梁文锋落子 DeepSeek 的隐秘故事
2025-03-04 17:51
巴比特
2025-03-04 17:51
订阅此专栏
收藏此文章

TTPRO1589103-3-sr_x2.0.png图片来源:由无界 AI 生成


春节期间一夜震惊全球的 DeepSeek,让杭州一跃成为全国“顶流”。当大众的目光都聚焦于杭州时,却很少有人知晓,DeepSeek 旗下最早注册的公司位于北京,直到 2 个月之后杭州深度求索才成立。


现在,DeepSeek 位于北京的办公室,更是每日门庭若市、访客如织。智东西带着诸多疑问,走访 DeepSeek 位于北京海淀区的融科资讯中心的办公室,并与多位了解 DeepSeek 情况以及曾经在 DeepSeek 工作过的人士交流,发现这家火爆全球的公司背后很多不为人知的故事。


DeepSeek 的公司主体虽坐落于杭州,但它在北京的子公司,却在海淀霸气地包下了融科资讯中心一整层楼,占地面积达 2100 平方米左右。据了解,DeepSeek 目前员工数量为 160 人,即使都就职在北京,若按 70% 来计算写字楼的使用面积,人均办公面积最少能达到 9 平方米。如此宽敞的办公环境,对创业公司而言十分罕见。


不仅硬件条件堪称 “豪华”,DeepSeek 的工作氛围也极为宽松。在如今竞争激烈、节奏紧凑的职场环境下,其招聘以应届生为主,且员工无 KPI、不打卡,以兴趣导向为主。


宽松的办公环境背后,梁文锋在薪资方面出手颇为大方,幻方量化资深数据科学家年薪是竞对两倍,DeepSeek 在招岗位年薪已经过百万。


智东西根据公开信息梳理了 DeepSeek 员工毕业院校发现,DeepSeek 北京大学毕业学生数量多于清华大学。有知乎网友认为,这是由于北大学生找实习宁愿去小公司,也不会选择清华系 AI 企业。



此前被称为“杭州六小龙”爆火出圈,为何主要研发团队位于北京?北京与杭州公司发展不同之处是什么?DeepSeek 的成功与其选人、用人标准有何关联?这种近乎“理想化”的工作模式,究竟是如何实现的?我们试图通过公开信息和走访相关人士,来找到这些问题的答案。


DeepSeek 开启时代转折的关键选址,北京是起点


在梳理 DeepSeek 的发展脉络时,一条隐藏在时间长河中的神秘线索逐渐浮出水面,用八个字概括就是——北京开花,杭州结果。


通过梳理这家公司成立的时间线,我们发现,DeepSeek 的公司主体最早于 2023 年 5 月在北京成立,名叫北京深度求索人工智能基础技术研究有限公司(下称北京深度求索),比目前 DeepSeek 的主体公司杭州深度求索人工智能基础技术研究有限公司(下称杭州深度求索)早两个月。杭州深度求索成立于 2023 年 7 月。



有意思的是,在成立初期,杭州深度求索是北京深度求索的全资子公司。


不过更有意思的是,2023 年 8 月,这两家公司角色发生对调。


北京深度求索将股权全部转让给宁波程恩企业管理咨询合伙企业(有限合伙)和梁文锋,杭州深度求索注册资本从 100 万元增至 1000 万元。


▲北京深度求索股权变更信息(左)、杭州深度求索股权变更信息(右)


自此形成了现在 DeepSeek 的布局,杭州深度求索是 DeepSeek 主体公司,北京深度求索是子公司。


春节以来,北京深度求索所在的融科资讯中心成为各路玩家打卡的热门地点。


地理位置来看,融科资讯中心周边的高校、知名公司众多。周边聚集清华大学、北京大学、中国科学院等 40 余所知名高校和研究院所,园区内还有苹果、微软、AMD、英伟达等全球市值名列前茅的科技公司以及一众国内科技创业公司。


▲融科资讯中心周边(图源:百度地图)


2024 年 5 月,DeepSeek 入驻融科资讯中心,并包下了一整层楼,面积约 2100 平方米左右。新希望集团董事长刘永好最近透露,在和 DeepSeek 创始人梁文锋交流中获悉,DeepSeek 目前员工人数为 160 人。也就是说,即使所有员工都就职北京,若按 70% 来计算写字楼的使用面积,人均办公面积最少也能达到 9 平方米。


尽管 DeepSeek 的公司主体位于杭州,但是我们研究发现,DeepSeek 的大部分的研发人员、研发进展都在北京完成。


天眼查显示的员工体量中,DeepSeek 的整体规模并不大,且相比之下,杭州主体公司比北京更小。


基于天眼查大数据模型,结合不同行业企业的经营数据,如企业的资产总额、经营利润、人员规模等(其中上市 / 发债企业以合并报表口径),综合计算形成的 L(大型)、M(中型)、S(小型)和 XS(微型)四类企业规模分类体系,北京深度求索为中型,杭州为微型。



两个公司的体量有明显差别。这可以看出,该公司的业务、研发重心可能都在北京。


有意思的是,DeepSeek 目前拥有多个域名,其中 deepseek.cn 于 2023 年 9 月 4 日在北京进行了 ICP 备案(互联网信息服务备案),而 deepseek.com 是 2024 年 1 月 23 日才在杭州完成备案。



对于大模型企业而言,算法备案和大模型备案至关重要,这是企业能将模型向公众开放服务的两个必要条件。


目前来看,DeepSeek 算法备案已经在北京和杭州先后完成,时间是分别是 2024 年 4 月和 2024 年 6 月。



大模型备案 2024 年 5 月在北京通过。这或许与北京市在全国大模型备案方面的布局是最早一批相关,2023 年 8 月北京市就已经披露首批通过备案的大模型。



另外一个有意思的是,DeepSeek 的两家商标代理机构均是北京企业。



可以看到,初期 DeepSeek 的发展与北京密不可分。


独一无二的制胜之道:应届生扛大梁,梁文锋本人除了编程没其他爱好


同在顶尖人才聚集“包围圈”,为何 DeepSeek 率先冲出来并改变整个大模型产业的竞争格局?种种迹象表明,或许DeepSeek 别具一格的员工体系以及梁文锋身上独特的人格魅力,暗藏着某种制胜密码。


值得一提的是,坐落于名校聚集地的 DeepSeek,其员工中清北等北京知名高校的含量极高。


2023 年 5 月,DeepSeek 创始人梁文锋曾在接受暗涌 Waves 采访时提到,DeepSeek 的核心技术岗位,基本以应届和毕业一两年的人为主。据一位曾在 DeepSeek 实习的学生回忆,DeepSeek 招聘时以应届生为主,学历是硕博、工作背景为大语言模型相关。


据智东西不完全统计,DeepSeek 已经发布的论文的作者名单中,其中有超过一半员工仍就读或毕业于北京大学、清华大学、北京师范大学、北京邮电大学、北京航空航天大学等知名高校。此外其员工还有少数毕业于麻省理工学院、卡内基梅隆大学等海外知名高校,大部分都具有交叉学科背景。


例如,DeepSeek 上月发布的一篇最新论文,第一作者就是北京大学硕士研究生袁景阳,他在 DeepSeek 实习时是 DeepSeek-V3 技术报告的主要作者之一,还参与了 DeepSeek-R1 项目;DeepSeek-V2 的关键创新 MLA 架构由北大和北邮的毕业生主导研发;盛传雷军千万年薪挖掘的 DeepSeek 95 后 AI 天才少女罗福莉也毕业于北大……


▲DeepSeek 最新论文


目前公开的招聘信息也呈现出这一趋势。


从招聘平台 Boss 直聘上的公开信息来看,目前 DeepSeek 的招聘岗位共有 34 个,涉及大模型全栈工程师、深度学习研发工程师等核心技术人员,从数量来看北京招聘岗位有 24 个,杭州有 10 个。



除了员工构成外,DeepSeek 的整个管理模式也与众不同。


北京通用人工智能研究院助理院长郑卿告诉智东西,从 DeepSeek 的员工结构来看,他们在选人时打破传统标准,以年轻人为主,且相比于资历、经验,更看重人的能力和对工作的热情。


与很多 CEO 不一样,创始人梁文锋会深度参与一线工作。她补充说,DeepSeek 的管理扁平化,DeepSeek 创始人梁文锋会在一线,没有分级管理模式。微信公众号聪明投资者的文章就提到,2018 年同事对梁文锋的评价就是——除了编程,没有什么其他的爱好。


拥有顶尖的人才,并能有效激发其创新活力,与 DeepSeek 这种独特的员工结构相辅相成。


梁文锋打造“研发乌托邦”:百万年薪,无 KPI 不打卡


如此宽松的办公条件,又营造出了如何独特的工作氛围?这也是 DeepSeek 崛起之路上拼图的关键碎片。


查阅公开信息可以发现,DeepSeek 在北京的注册地点一开始在北京市海淀区丰慧中路 7 号新材料创业大厦,同年 11 月变更至北京市海淀区科学院南路 2 号的融科资讯中心,并于 2024 年 5 月正式入驻。


据了解,广纳国际顶尖公司的融科资讯中心占地共 8 公顷,总建筑面积有 32.8 万平方米,但容积率仅为 3.1,且是北京市四环内唯一绿化率达到 42% 的园区。


由于此时想要拜访 DeepSeek 的各路人士非常多,因此其物业公司还在 DeepSeek 所处楼层单独加装了闸机,并增设了安保人员。


硬件条件拉满,公司的办公氛围较为轻松。


据曾在 DeepSeek 实习的学生透露,他们没有固定上下班时间、没有 KPI。工作模式以小方向、兴趣导向为主,每周定期讨论研究进度。


谈及对梁文锋的印象,他补充说,梁文锋对员工没有约束,会参加公司的主要项目研发,且在保证工作的前提下,会提供更多福利,给实习生的额外补贴。


▲DeepSeek 创始人梁文锋


2023 年 5 月,梁文锋曾在接受暗涌 Wave 采访时提到,创新需要尽可能少的干预和管理,让每个人有自由发挥的空间和试错机会。创新往往都是自己产生的,不是刻意安排的,更不是教出来的。


一位去年 9 月离开 DeepSeek 的员工说:“梁文锋给了我们控制权,把我们当作专家对待。他不断地提出问题,并与我们一起学习。DeepSeek 让我负责核心研发部分,这非常令人兴奋。”


这样的人才结构、公司氛围对于 DeepSeek 这样偏研发型、产品层面工作并不复杂的公司而言更为适合。


北京科学智能研究院副院长李鑫宇解释说,AI 发展到今天,对于人才的学习能力、动手能力要求更高,这一背景下,仍处于大学或刚毕业的学生其这两大能力正处于巅峰状态,且受到外界约束更少,因此也是这类人群在以算法创新为主的创业公司 DeepSeek 中,更适合做出突破性成果的形式。


因此,DeepSeek 的招人要求更看重——基础能力、创造性、热爱等。梁文锋说:“从这个角度看,国内合适的候选人就不少。”


除此以外,梁文锋在薪资水平上颇为豪气。曾有熟悉梁文锋的量化基金经理透露,在幻方量化,资深数据科学家年薪 150 万元并不罕见,而竞争对手的年薪很少超过 80 万元。


从目前 DeepSeek 公开的招聘信息可以看出,其在招的深度学习研究员 -AGI‌月薪 8 万至 11 万元,年薪最高可达 154 万元‌,‌核心系统研发工程师(校招)‌月薪 6 万元至 9 万元,按一年 14 薪估算后,年薪最高可达 126 万元‌,‌大模型全栈工程师‌月薪 5 万元至 8 万元,年薪最高可达 112 万。


扎根 AI 人才“富矿”,政府千亿投资基金已落地


在 AI 产业这片顶尖人才激烈角逐的“战场”上,人才无疑是决定企业命运的关键因素。从这个层面来看,DeepSeek 将研发重心放到北京有一定的必然性。


国内 AI 相关学科的建设相比发达国家仍有一定差距。2022 年教育部发布《研究生教育学科专业目录》,将智能科学与技术设立为交叉学科门类中的一级学科。


郑卿谈道,事实上,当前国内顶尖的 AI 人才在我国整个就业市场上仍处于稀缺状态,人才的自主培养就更显紧迫。人才培养是一个长期的过程,可以从课程设置、师资与应用实践等方面着手,致力于培养跨领域复合型的顶尖人才。


在人才稀缺与 AI 产业发展加速的背景下,北京在 AI 人才方面的领先优势就更为受到关注。


一直以来,北京都是 AI 人才的聚集地。北京市科学技术委员会、中关村科技园区管理委员会的数据显示,北京 AI 学者已经超过 1.5 万人,全国占比为 30.6%,位居第一。


据统计,北京已有北京大学、清华大学、北京航空航天大学等 30 余所高校获批人工智能本科专业,有 20 余所高校设立了人工智能学院或研究院,32 所高校拥有与人工智能直接相关学科的博士、硕士学位授权,在校研究生 4.4 万人,教师及科研人员 1.2 万人。


人才和资金支持无疑是当下 AI 发展的必要条件,而北京市在政府产业基金投入方面更是雷厉风行。


近两年,北京在 AI 产业的投资力度正持续增加。


2019 年以来,北京海淀区、经济技术开发区、顺义区政府政府投资基金都不断扩容,包括北京海淀中关村科学城科技成长三期基金发布,基金总规模增至 200 亿元;北京经济技术开发区政府投资引导基金二期宣布将正式设立,总规模 100 亿元;北京顺义股权投资引导基金(有限合伙)正式发布,远期规模 100 亿元,首期 10 亿元……


此外,2024 年,北京市一口气落地 8 支产业基金,资金规模为 100 亿元或 200 亿元,涵盖机器人、AI、先进制造和智能装备多个领域。


就在上个月,北京举行的《北京具身智能科技创新与产业培育行动计划(2025—2027 年)》专场新闻发布会中就明确提到,北京已设立总规模 1000 亿元、存续期 15 年的政府投资基金,重点支持 AI、机器人等未来产业领域。


目前国内几大一线城市的创投产业发展蓬勃,根据清科研究中心的数据,2024 年募资规模北京、浙江、江苏位列前三,规模分别为 1892.79 亿元、1826.64 亿元、1717.80 亿元;全国投资金额规模第一为上海,达 1101.45 亿元,北京位居第二达 1042.72 亿元,第三是深圳金额为 409.14 亿元。这之中北京募资规模居全国首位,投资规模位列第二,是不折不扣的创投高地。


结语:打造 AI 超级生态,催生“DeepSeek”类企业涌现


从大模型产业爆发到 DeepSeek 这一 AI 界现象级公司诞生,全国城市在新兴产业的竞赛更加白热化。


对于 AI 产业而言,其发展具有很强的全局性,其技术研发涉及到数学、计算机科学、统计学、神经科学等多个学科领域,应用场景涵盖医疗、交通、金融、教育、制造业等几乎所有行业,再加上 AI 产业的上下游产业链长,从基础的算法研究、芯片制造,到中间的模型开发、数据标注,再到下游的应用产品开发和服务提供,各个环节都紧密相连。


因此,从政府层面,北京、杭州、上海、深圳等城市已经接连发布各项支持政策、加强资金投入、人才引进等措施,围绕着 AI 产业的算力集群、数据供给、场景应用等加速 AI 的发展和普及。


在此基础上,城市力量正依托于完备的 AI 发展生态体系,形成强大的成果转化能力,让更多的“DeepSeek”涌现出来成为可能。





中国 AIGC 产业应用峰会回顾

2024 年 1 月 5 日,【智求共赢・中国 AIGC 产业应用峰会暨无界 AI 生态合作伙伴大会】在杭州未来科技城会议中心举行。


大会汇集行业资深专家及领军企业,共同聚焦 AIGC 领域,围绕当下热点话题进行深度延展,探讨行业激烈竞争下的运营新思路、发展新模式!点击文章,回顾精彩内容~










AI 新智界园区开放合作啦!


【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

巴比特
数据请求中
查看更多

推荐专栏

数据请求中
在 App 打开