
▼
过去半个月,关于"梁文锋终于低头融资"的消息在创投圈悄然发酵。意向估值至少100亿美元,融资规模不低于3亿美元,腾讯、阿里正在洽谈入局。对于那个曾经多次拒绝顶级风投、坚持用幻方量化输血做研究的"技术理想主义者"而言,这几乎是一次"人设反转"。
但更值得关注的是另一组数据:在刚刚发布的DeepSeek V4技术报告中,一份长长的DeepSeek最新一代模型作者致谢名单,10个名字被悄然标注为“已离职”;而在名单主体部分,超过260个署名依然整齐列阵。
研究工程团队约270人中,仅有10人在研发期间离去。
换算成比例,核心研发团队的流失率被死死压在4%以内,整体员工留存率触及97%。
喧嚣之外,这组数字映射出的,是一个更为平和、也更为复杂的现实:当外界还在争论"理想主义能否对抗资本碾压"时,梁文锋已经用一场静默的组织战役,守住了最核心的基本盘。
而这,或许才是本轮融资真正的起点。
01"10人离职"背后:一场被误读的"人才危机"
2026年4月下旬,DeepSeek V4技术报告正式发布。在致谢名单的末尾,10个名字被标注为"已离职"。其中不乏王炳宣、郭达雅、阮翀等被外界视为"技术骨干"的成员。
(王炳宣:DeepSeek第一代大语言模型核心作者,加入腾讯混元、郭达雅:R1核心研究员、DeepSeek-Coder系列第一作者,加入字节Seed团队、阮翀:DeepSeek多模态领域核心贡献者,加入元戎启行、罗福莉:被冠以"95后天才少女"之名,DeepSeek-V2核心开发者,加入小米MiMo大模型团队;离职时间早于V4研发周期,故未出现在本次技术报告的"已离职"标注名单中)
消息一出,舆论迅速发酵:"核心人才流失""技术路线受挫""融资是为挽留残局"……各种解读铺天盖地。
但如果你把镜头拉远,会发现另一幅图景:
DeepSeek研究工程团队总规模约270人,10人离职,占比3.7%;
对照同期头部大模型企业的研发人员流动率(普遍在12%-18%区间),这一数字属于行业极低水位;
对比之下,OpenAI在过去两年流失了超过25%的关键研究人才;
更关键的是,流失节点高度集中于一轮密集的技术里程碑发布之后,且去向高度分化:部分切入终端厂商的轻量化模型团队,部分转向自动驾驶的垂直场景,少数进入巨头的基础研究实验室。
这不是"流失",这是"筛选"。
一位接近幻方量化的投资人告诉我们:"在当下这个节点,能用不到4%的离职率守住一支200多人的精锐部队,本身就是一种组织能力的证明。"
更关键的是,离开的10人中,多数属于"能力溢出型"流失——他们在DeepSeek完成了关键技术积累后,被大厂用数倍薪资精准挖角。这本质上是一场"定价权战争":当你的核心员工发现,同样的能力在市场上能卖出3倍价格时,仅靠"做最前沿的事"已经不够了。
坊间有个打趣的说法:"当DeepSeek内部成员发现段位差不多的人跳槽出去能拿到那么多,那我为什么不可以?"
梁文锋显然意识到了这个问题。
测试的结果很明确:DeepSeek的技术资产在二级市场具备强流动性,这反而印证了团队过去三年在MoE架构优化、条件记忆机制、流形约束超连接等底层方向的投入没有走偏。更重要的是,流失并未击穿核心管线。基座训练、推理加速、系统对齐三条主干线的负责人均未变动,技术代际迭代的连续性得以保全。
一家技术驱动型公司的护城河,从来不在于“一个人都不走”,而在于“走的人带不走系统,留下的人能持续迭代”。97%的留存率,恰恰证明了DeepSeek在过去几年建立的研发协同网络、代码资产沉淀与工程化方法论,已经形成了较高的替换成本。人才可以流动,但技术栈与工程习惯具有强路径依赖。这才是97%背后的真实壁垒。
02融资真相:3亿美元买的不是算力,是"期权定价权"
理解了人才战争的底层逻辑,才能看懂梁文锋融资的真实意图。
表面看,这是一次"向资本妥协"。但深挖一层,你会发现:3亿美元,在今天的AI算力军备竞赛中,甚至搭不满一个像样的GPU集群。
那这笔钱究竟用来做什么?
答案不在硅晶圆里,而在那些正在离开的人的合同里。
对于一家长期依赖母公司幻方量化"输血"、创始人多次拒绝外部投资的公司而言,融资的核心目的很可能不是为了获取现金,而是为了获得一个被资本市场"公证"过的价格。
这本质上是一个为期权定价的游戏。
创业公司期权的魅力在于其巨大的增值潜力,但前提是这个潜力要被市场认可。在没有外部机构真金白银入场确认之前,估值更多是创始人层面的数字游戏。一旦像红杉、高瓴这样的顶级机构,按照100亿美元的估值投下3亿美元,这个数字就被盖上了官方的印章。
员工手里的期权,突然就有了一个清晰、可比较的市场价值锚点,可以用来衡量字节、腾讯开出的现金offer。
一位FA机构人士向我们透露:"此次融资大概率是为了做员工期权的二级市场定价与早期兑现通道搭建。动作确实晚了,但在当前节点仍具备战略价值。"
"晚了"二字,道出了技术理想主义者在商业化进程中的困境。创始人可以接受延迟满足,但核心骨干的家庭规划、资产配置与职业选择具有明确的时间窗口。当同样的技术能力在市场上出现价格倒挂时,仅靠“做最前沿的研究”已无法维持组织稳态。
2023年后,DeepSeek未再进行外部融资,员工期权协议没有明确的公司估值支撑,流动性几近于零。梁文锋曾以类似OpenAI与微软的"回报上限"协议尝试接触投资人,但因条款复杂、退出路径不清晰而搁置。
你可以跟员工谈理想、谈技术氛围、谈在做最前沿的事。但当大厂也开始做最前沿的事,并且开出的价码是你的数倍时,仅靠理想就显得不够了。
这不是道德命题,这是金融命题。
所以,梁文锋的"反常"融资,更像是一个理想主义者在现实规则下的清醒妥协。与其看着自己一手培养的团队散伙,让兄弟们带着一身本事去给别人打工,不如开门迎客,引入资本,为公司挂上一个市场公认的价牌。
有了这个价牌,才能给留下的兄弟们一个继续并肩作战的理由,清晰测算继续坚守的期权增值空间;有了这块价牌,未来的技术招聘才能摆脱“纯情怀吸引”的单一路径,进入“技术前景+财务回报”的双轮驱动。
3亿美元买来的不是算力,是组织稳定的定价权。100亿估值锚定的不是当前营收,是技术代际跃迁的贴现率。这笔交易的核心标的,从来不是硬件,而是人。
03技术突围:从"低成本奇迹"到"国产算力适配"
如果说融资是"守人",那么技术路线的转向就是"攻局"。
2026年4月24日,DeepSeek V4发布。这不是一次常规的模型迭代,而是一次战略级的技术宣言:
总参数推至1.6万亿,首次将百万token上下文打成标配;
百万上下文下每token的算力消耗仅为V3.2的27%,KV缓存占用只有10%;
支持三档推理强度,针对Agentic Coding专项优化,内部评测交付质量已接近Claude Opus 4.6的非思考模式;
最关键的是:首次在官方技术报告中,把国产芯片和英伟达GPU写进了同一份硬件验证清单。
适配的华为昇腾950PR推理芯片于2026年3月量产,单卡算力较英伟达对华特供版H20提升2.87倍。采购价格约为英伟达H200的三分之一到四分之一,绝对算力则是H200的一半。
从成本角度看,这是一次理性的商业选择。但更深层的逻辑在于:大模型正从"训练为王"逐渐转向"推理决胜"的时代。
2026年3月的GTC大会上,黄仁勋宣布:推理的拐点已经到来,需求还在不断增长。他指出过去两年AI计算需求激增了1万倍,行业重心正在从一次性、高成本的模型训练,转向持续性的推理服务。
在低精度推理场景下,华为昇腾950PR的SIMD/SIMT新同构设计、低精度数据格式支持和自研HBM,能展现出超越通用GPU的效率。不仅更便宜,而且更高效。
跳出英伟达架构是一条高风险、高收益的新路。风险在于,CANN不是一个非常成熟的架构,第三方库支持、调试工具链仍不及CUDA,对于个人开发者和小团队而言迁移门槛依然存在。
但如果V4在华为芯片上跑出有竞争力的性能,它将是全球第一个不依赖英伟达的前沿AI模型。这意味着中国AI产业将拥有完全自主的算力底座,不再受制于华盛顿的出口管制。
这也意味着中国的AI企业们会直接坐在金山上。根据OpenRouter的数据,2026年3月30日-4月5日,中国AI模型的周调用量突破12.96万亿Token,是同期美国的4.3倍。国产化无疑有着巨大的市场前景。
黄仁勋本人也曾公开表达对中国芯片的忧虑。4月15日,他在彭博社播客访谈中罕见发飙,当众反驳"芯片是浓缩铀,不该出口给中国"的说法。他警告:过度限制无法阻止中国进步,反而会逼中国建立完整的自主生态。
封锁,正在成为最好的催化剂。
04组织重构:当"极客文化"撞上"商业现实"
人才、技术、资本,三者之外,还有一个更底层的变量:组织。
DeepSeek过去长期不融资,导致员工期权无法兑现,人才激励只能依赖理想和技术挑战。这种模式在早期研发阶段是优势——决策链路短、文化纯粹、技术聚焦;但在商业化加速期,却可能成为瓶颈。
一位长期跟踪大模型赛道的投资人告诉我们:"纯研究型组织的职业天花板、治理结构单一、极客文化的排他性,都是核心成员集中流失的潜在诱因。"
梁文锋显然意识到了这个问题。
在融资启动的同时,他同步推进了内部股权结构调整:注册资本由1000万元增加至1500万元,梁文锋认缴的注册资本由10万元增加到510万元,直接持股比例由1%升至34%。
这一动作的潜台词很清晰:创始人正在通过增持,强化对公司的控制权,为后续的组织重构和战略决策预留空间。
但这还不够。
当公司从"技术实验室"转向"商业实体",组织能力的重构必须同步跟上。这至少包括四个维度:
激励体系产品化:从“理想驱动”转向“理想+财务回报”双轨制,建立清晰的期权成熟曲线、内部流转机制与早期兑现通道,让技术贡献可量化、可预期、可交易;
治理结构多元化:引入外部董事或顾问,平衡技术决策与商业判断,避免创始人一人审美的局限;
人才策略复合化:在保持极客文化的同时,适度引入具备系统架构、商业化落地、生态运营经验的“桥梁型”人才,打通技术到产品的最后一公里;
文化内核迭代:从"只做最前沿的事"转向"在前沿与落地之间找最优解",让工程价值真正转化为商业价值与社会价值。
这四重重构的难度,远超一笔3亿美元的融资。它要求创始人在保持技术敏锐的同时,完成从“首席科学家”到“组织架构师”的角色跃迁。
05中国AI创业公司的集体困境
把镜头拉远,你会发现:DeepSeek的融资与转向,折射出的是中国AI创业公司的集体困境。
在技术迭代以月为单位、资本开支以百亿为单位的军备竞赛中,"中小厂"的研发窗口正在急剧收窄。智谱和MiniMax已先后赴港上市,月之暗面正以180亿美元估值完成新一轮融资。当大厂们挥霍着源源不断的弹药,创业公司们只能选择求助资本市场。
而全球视角下,这场战争的对比更为直观:
北美头部AI企业在2025-2026财年普遍面临百亿级亏损压力,但凭借资本市场的高流动性与美元基金的长期耐心,依然维持着高强度的研发与基建投入;
国际顶级机构的融资规模与估值倍数屡创新高,二级市场的隐含定价已突破万亿美元量级,行业进入“赢家通吃”的加速期;
资本密集度与技术壁垒的双升,正在将AI赛道从“创新实验场”推入“工业化竞赛”。
这不是商业竞争,这是国家级的科技博弈。
在这种背景下,DeepSeek仍有其独特优势,这些特质在过去被视为“非主流”,在今天正成为构建长期竞争力的核心要素:
开源策略与低成本方法论:已在全球开发者社区建立了品牌认知,证明了不依赖算力堆砌的研发能力;
底层技术创新:在MoE架构、条件记忆机制(Engram)、流形约束超连接(mHC)等方向的突破,展现了技术深度;
国产算力适配的先发优势:如果V4能在国产芯片上跑出有竞争力的性能,将证明中国AI公司可以在被制裁的环境下,用更少的钱、更自主的供应链,做出世界一流的产品。
DeepSeek的100亿估值与97%留存率,不是一个孤立的商业事件,而是一次行业范式的验证:中国AI公司完全可以在外部资本环境复杂、算力供应链受限的条件下,通过技术自研、组织进化与资本工具的协同,走出一条不依赖单一外部输血的内生增长路径。但这并不意味着路径已经畅通,相反,挑战同样严峻:
引入外部融资是否会掣肘技术创新的独立性?
芯片国产化是否意味着,在一定阶段中美大模型技术的切割甚至差距拉大?
开源策略与商业化变现之间如何建立可持续的飞轮?
V4暂不支持原生多模态功能,而Gemini 3.1 Pro已实现"全模态",这是否会成为产品体验的短板?
这些仍是悬而未决的变量。
产业竞争的终局,从不取决于单次融资的规模或单款模型的参数,而取决于谁能将技术优势转化为持续的工程效率,将人才密度转化为组织韧性,将资本杠杆转化为生态壁垒。
06不诱于誉,不恐于诽
回到梁文锋。
很多人将他视为中国AI理想主义的一个样本,证明不靠资本也能做出好东西。他没有赢在“不让任何人走”,而是赢在“走的人不影响主线,留下的人有明确预期”;他没有赢在“拒绝资本”,而是赢在“用资本完成定价,用定价稳固组织”;他没有赢在“参数第一”,而是赢在“在算力受限的环境下,把推理成本打穿,把国产适配跑通”。
这三场胜利,没有一场是侥幸。它们建立在极其克制的研发节奏、极其清醒的商业判断、以及极其坚韧的工程文化之上。
当罗福莉、王炳宣、郭达雅们一个接一个被大厂用真金白银挖走,当下一代模型因为人手不足而进展迟缓,强如梁文锋也不得不面对这个事实:在这个时代,理想主义也需要一个明确的价格标签。
但这不等于理想的背叛。
创业公司靠理想起跑,但必须靠规则续航。当顶尖人才可以被精准定价、当算力供应链需要自主重构、当技术代际更迭进入工业化阶段,情怀与愿景依然重要,但明确的商业价值锚点、清晰的激励路径、多元的治理结构,才是支撑理想落地的基础设施。
100亿美元的估值,3亿美元的融资,这两个数字组合在一起,构成了一个清晰的市场信号:即使是曾经最纯粹的技术理想主义者,也不得不在这场资本与人才的双重游戏中,寻找自己的生存策略。
这场融资或许能暂时稳住团队,但真正的考验才刚刚开始。当资本进入,期望就会改变;当估值抬高,压力就会增大。梁文锋能否在保持技术创新的同时,驾驭好这艘已经驶入资本市场深水区的大船?
梁文锋的惊险一跃,如果成功,跨越的将不仅是一家公司的生存周期,而是整个中国AI产业在复杂外部环境下,验证一条自主可控、可持续创新路径的可能性。
这条路注定漫长,且充满不确定性。在资本狂潮与技术理想之间,中国AI创业公司的出路究竟在哪里?
或许答案就藏在《荀子》的那句古训里:"不诱于誉,不恐于诽。"
不因赞誉而迷失,不因诋毁而退缩。
以工程为尺,以效率为矛,以定价为盾。
这条路,注定艰难。
但值得所有人为之期待。
本文数据来源于公开报道、行业报告及多方信源交叉验证。部分融资细节及薪酬数据因涉及商业机密,采用区间表述,技术参数以DeepSeek官方技术报告为准。
下一站
欢迎来 AiDD ,一起成为这场范式重构的参与者与制定者,一起定义 AI 时代的技术领导力。
