4006-998-758
新闻动态

阿里「握指为拳」,英伟达「龙虾上桌」:2026,全球 AI 战争进入「Token 经济元年」

2026-03-18

21-26031P91105Q0.png



当吴泳铭亲自挂帅「Token Hub」,当黄仁勋把「龙虾」端上算力餐桌,这场战争的计量单位,已经从「模型参数」变成了「每秒消耗多少 Token」。



01    3 月 16 日晚间,阿里按下「战略重组键」



2026 年 3 月 16 日晚间,阿里巴巴内部发出一封全员邮件。没有预热,没有公关通稿,只有简短有力的战略宣告:正式成立 Alibaba Token Hub(以下简称 ATH)事业群,由集团首席执行官吴泳铭直接负责,全面推进 AI 战略落地。

这不是普通的人事调整,而是一次战略级的「握指为拳」。

根据邮件内容,阿里将通义实验室、MaaS 业务线、千问事业部、悟空事业部及 AI 创新事业部五大核心板块,全部纳入 ATH 同一指挥体系。更值得玩味的是,一个此前从未公开的神秘代号首次浮出水面:「悟空事业部」。据多方信源确认,该部门定位于打造 B 端 AI 原生工作平台,剑指企业级智能体(Agent)市场。

这意味着什么?

意味着阿里不再把 AI 当作一条产品线、一个技术中台、甚至一朵云来运营。阿里正在围绕「Token」这一最底层的算力与模型消耗单位,重新组织研发、平台、应用和商业化的全链路。

「创造 Token、输送 Token、应用 Token」——这十二个字,是 ATH 事业群的核心目标。翻译成行业语言:阿里要构建一条完整的「AI 工业化流水线」,从模型训练(创造)、推理服务(输送)到场景落地(应用),实现端到端的效率闭环。

这不是优化,这是重构。

在邮件发出后的内部沟通会上,吴泳铭明确提出了新的考核导向:从「模型榜单排名」转向「Token 消耗规模×商业转化率」。这一信号极其强烈——在资本寒冬与竞争白热化的双重压力下,阿里必须证明其 AI 投入能产生可量化的商业回报。而「Token」,正是连接技术价值与商业价值的最短路径。

让集团 CEO 直接带队一个事业群,这在阿里历史上极为罕见。上一次出现类似场景,还是 2014 年阿里云成立初期,王坚博士顶着「骗子」的骂名,在内部资源极度紧张的情况下硬扛云计算战略。今天,吴泳铭的「亲征」,释放的信号同样强烈:AI 不是阿里的「未来选项」,而是「生存底线」。

据内部人士透露,此次重组前,阿里的 AI 版图存在明显的「割裂感」:通义实验室专注技术突破,阿里云负责商业化落地,钉钉、夸克等应用层各自为战。这种「烟囱式」架构在技术探索期尚可容忍,但在规模化竞争阶段,却成了效率的杀手。

吴泳铭的解法很「阿里」:用组织变革倒逼战略协同。

  • 汇报线扁平化:五大板块直接向吴泳铭汇报,减少中间层决策损耗;

  • 资源调度集中化:算力、数据、人才优先保障 ATH 事业群;

  • 考核指标重构:一切围绕 Token 的生产效率与商业变现。

这套架构的本质,是把「模型能力」转化为「可计量、可调度、可计费」的标准化服务单元。就像云计算把服务器资源变成「核/时」「GB/月」,阿里正在把智能变成「Token/次」「Agent/流程」。

谁掌握了 Token 的工业化生产能力,谁就掌握了下一代智能经济的「水电煤」定价权。




02    英伟达的「龙虾」:算力战争的「吨位级」升级


就在阿里重组消息发酵的同一周,大洋彼岸的黄仁勋,在 GTC 2026 上扔出了另一枚「核弹」。

英伟达正式发布 Vera Rubin 架构,新一代 GPU 推理性能相较 Blackwell 提升显著,其中 NVFP4 推理算力达到 50 PFLOPS,是 Blackwell 的 5 倍;而在每瓦吞吐量这一关键效率指标上,提升幅度高达35 倍。

更引人注目的是,黄仁勋特意在演讲中提及「中国龙虾热」,并顺势推出英伟达版「龙虾」——NemoClaw 互联架构。

这不是玩梗,这是技术隐喻。

很多媒体标题党式地解读为「龙虾 GPU 来了」,这是严重的误读。实际上,「龙虾」是黄仁勋对 NemoClaw 架构特征的生物学隐喻,旨在形象化解释其三大技术突破:

  • 外骨骼= 3nm 工艺 + 3360 亿晶体管 + 288GB HBM4,打造极致算力密度与保护机制;

  • 关节= NVLink 72 全互联 + 260TB/s 带宽,解决万卡集群通信瓶颈,如同龙虾关节般灵活高效;

  • 集群= Dynamo 软件栈,将推理任务智能拆解,实现 Rubin GPU 与 Groq 等专用芯片的协同调度,如同龙虾集群行动。

这套组合拳的目标极其明确:让万亿参数模型的推理成本,降到企业可规模化商用的临界点。

一个关键数据:Rubin GPU 单卡搭载 288GB HBM4,带宽 22TB/s。这意味着,过去需要百卡集群才能跑通的超大模型,现在可能只需十几张卡。对于追求成本敏感的企业级应用而言,这不仅仅是性能提升,更是商业模式的颠覆。

算力战争,已经从「拼参数」进入「拼吨位」时代——谁能在单位成本下输出更多有效 Token,谁就能在应用层抢占先机。

值得注意的是,英伟达此次特别强调了「每瓦吞吐量」的 35 倍提升,而非单纯的峰值算力。这背后是对全球能源瓶颈的精准预判。当数据中心功耗成为制约 AI 扩张的最大物理障碍,能效比(Performance per Watt)取代绝对算力(FLOPS),成为衡量芯片价值的新黄金标准。

阿里与英伟达,看似相隔万里,实则在这一逻辑上达成了惊人的默契:

  • 阿里通过组织重组,优化「Token 生产流程」,降低软件与协作成本;
  • 英伟达通过架构创新,优化「Token 物理成本」,降低硬件与能源消耗。

两者共同指向同一个终点:Token 的边际成本必须无限趋近于零,AI 才能真正的普及。



03    为什么是「Token」?一场关于「战争计量单位」的认知升维



在 2023 年,行业谈论的是「参数规模」:千亿、万亿、十万亿; 在 2024 年,焦点转向「推理成本」:每千 Token 多少钱、延迟多少毫秒; 而到了 2026 年,「Token」本身,正在成为衡量一切的新本位。

为什么?

因为当大模型从「技术奇迹」走向「商业基础设施」,真正的瓶颈不再是「能不能做出来」,而是「能不能规模化、低成本、高可靠地持续输出」。

一个企业级 AI 应用,每天可能消耗数百万甚至上千万 Token。如果单次推理成本降不下来、服务稳定性扛不住、业务场景接不进去,再强大的模型也只是实验室里的展品。

阿里此次重组的底层逻辑,正是对这一趋势的精准预判:

  • 通义实验室负责「创造 Token」:持续迭代基础模型能力,拉高技术天花板;

  • MaaS(Model as a Service)+ 千问事业部负责「输送 Token」:构建高可用、低延迟、弹性伸缩的推理服务网络;

  • 悟空事业部 + AI 创新事业部负责「应用 Token」:深入金融、政务、制造、零售等垂直场景,打磨 AI 原生工作流。

这套架构的本质,是把「模型能力」转化为「可计量、可调度、可计费」的标准化服务单元。就像云计算把服务器资源变成「核/时」「GB/月」,阿里正在把智能变成「Token/次」「Agent/流程」。

谁掌握了 Token 的工业化生产能力,谁就掌握了下一代智能经济的「水电煤」定价权。

这种转变带来的影响是深远的。过去,企业购买 AI 服务,买的是「账号」、买的是「功能模块」;未来,企业购买 AI 服务,买的是「Token 包」、买的是「智能工作量」。

这将彻底重构 SaaS 行业的定价模型。

想象一下,未来的 CRM 系统不再按「用户数」收费,而是按「智能客服处理的对话 Token 数」收费;未来的 ERP 系统不再按「模块」收费,而是按「自动生成报表消耗的算力 Token」收费。

Token 经济,本质上是智能的「计件工资制」。

在这种模式下,模型提供商必须拼命优化效率,因为每一个 wasted Token 都是直接的成本损耗;应用开发商必须拼命优化场景,因为每一个无效调用都无法向客户计费。

这将倒逼整个产业链从「粗放式增长」转向「精细化运营」。那些只会调用 API 做套壳、没有场景优化能力的中间商,将在 Token 经济的透明账本下无处遁形。



04    中美算力博弈的「暗线」:当「自主可控」遇上「工业化效率」



阿里与英伟达的「隔空呼应」,背后是全球 AI 产业的两条平行叙事:

  • 中国路径:通过组织创新与场景深耕,在有限算力条件下实现最大商业价值;

  • 美国路径:通过架构突破与生态垄断,持续拉高算力门槛,巩固技术霸权。

这两条路,短期看是竞争,长期看可能是「错位共生」。

对中国厂商而言,英伟达的「35 倍能效提升」既是压力,也是镜鉴。它提醒我们:单纯靠「国产替代」的叙事已经不够了,必须在「单位算力效率」上实现突破。

在算力受限的现实背景下,中国厂商无法单纯依靠堆砌 GPU 数量来换取智能规模。因此,阿里此次重组的深意,或许正在于此:

  • 不盲目追求「参数军备竞赛」,而是聚焦「Token 产出效率」;
  • 不依赖单一芯片供应商,而是通过软件栈优化(如推理调度、模型压缩、量化部署)释放现有算力潜力;
  • 不等待「完美基础设施」,而是在真实业务场景中倒逼技术迭代。

这恰恰是中国科技企业的传统优势:在约束条件下创新,在实战中进化。

我们看到,阿里 ATH 事业群中,「悟空事业部」被赋予了极高的战略权重。这暗示了阿里的一种判断:通用大模型的竞争格局已定,未来的增量在于垂直场景的 Agent 落地。

在金融风控、供应链优化、代码生成等具体场景中,模型不需要「全能」,只需要「专能」。通过蒸馏、量化、RAG(检索增强生成)等技术,可以用 1/10 的算力解决 80% 的问题。

这种「场景定义算力」的思路,是中国厂商对抗「算力霸权」的有效武器。

当英伟达在追求「万能算力」时,中国厂商在追求「够用算力」。前者赢在生态广度,后者赢在落地深度。在 2026 年这个节点,随着企业客户从「尝鲜」转向「算账」,「落地深度」的权重正在急剧上升。



05    没有「银弹」,只有「Token」



写到这里,必须说几句「不中听但真实」的话。行业需要冷静,需要穿透泡沫看本质。

1. 「开源模型」不是护城河,「工程化能力」才是
阿里坚持开源通义千问策略,这值得尊敬。但开源解决的是「可用性」问题,商业竞争拼的是「可靠性 + 经济性」。当所有玩家都能拿到同样的基座模型,胜负手就落在:谁能把模型更稳、更快、更便宜地送到用户手里? 很多团队迷信「模型权重」,却忽视了推理引擎的优化、显存的管理、请求的调度。在 Token 经济时代,工程化能力带来的成本差异,可能高达 10 倍以上。这才是真正的护城河。

2. 「场景理解」比「技术炫技」更重要
悟空事业部剑指 B 端,这是明智之举。企业客户不关心你的模型在榜单排第几,只关心:能不能帮我降本?能不能帮我增收?能不能无缝嵌入现有工作流? 技术团队必须学会用业务语言对话。一个能自动完成「报销单审核 + 合规检查 + 打款」的 Agent,比一个能写诗画画的模型,在商业上值钱得多。AI 的价值,不在于它有多像人,而在于它能把人的工作流缩短多少。

3. 「组织协同」是比「算法创新」更难的课题
吴泳铭亲征的本质,是解决「大公司病」。当技术、产品、商业、运营分属不同体系,再好的战略也会在执行中衰减。阿里的这次重组,是一次高风险高回报的组织实验——成则一飞冲天,败则内耗加剧。 对于其他大厂而言,阿里的动作是一面镜子。你的组织架构,支撑得起 Token 经济的流速吗? 如果内部审批流程比模型推理还慢,那一切免谈。

4. 算力焦虑背后,是「认知懒惰」
很多团队把业务增长乏力归咎于「算力不够」,却不愿深入思考:我的场景真的需要万亿参数模型吗?能不能用蒸馏、量化、缓存、路由等工程手段,用 1/10 的算力解决 80% 的问题? 真正的技术深度,不是堆资源,而是做减法。在 2026 年,能把 100 亿参数模型优化出 1000 亿参数效果的公司,比单纯买到 1000 亿参数模型的公司,更有生存权。

5. 「Token 经济」将清洗一批伪 AI 公司
当计费单位变成 Token,一切都将透明化。那些靠「信息差」倒卖 API、靠「包装概念」融资的中间商,将面临灭顶之灾。客户会直接计算:我投入 1 元 Token 成本,能产生多少元业务回报? ROI(投资回报率)将成为 AI 项目的唯一通行证。无法证明正向 ROI 的项目,将在 2026 年被大规模砍掉。



06   2026,是「Token经济」的元年



如果把 2023-2025 年称为「大模型启蒙期」,那么 2026 年,就是「智能规模化」的启动元年,是「Token经济元年」。

这个阶段的特征非常清晰:

✅ 技术焦点:从「模型能力」转向「系统效率」
✅ 竞争维度:从「单点突破」转向「全链路协同」
✅ 商业逻辑:从「讲故事」转向「算账本」
✅ 组织形态:从「项目制」转向「战役制」

阿里成立 ATH 事业群,英伟达发布 Rubin 架构,看似是两家公司的独立动作,实则是同一历史进程的两面:

  • 一面是应用层的工业化:如何把智能变成可规模化交付的服务;
  • 一面是基础设施层的工业化:如何把算力变成可弹性调度的资源。

两者的交汇点,正是「Token」。

未来三年,我们可能会看到:

  • 更多大厂围绕「Token 经济」重构组织与产品;
  • 「每百万 Token 成本」成为比「模型参数」更受关注的行业指标;
  • AI 原生应用(Agent)从「概念验证」走向「批量复制」;
  • 中国厂商在「场景深耕 + 工程优化」路径上,跑出差异化竞争力。

这也意味着,AI 行业的「草莽时代」正式结束。

过去,只要有个 Demo、有个想法就能融资;未来,必须有清晰的单元经济模型(Unit Economics),必须有可验证的规模化路径。

Token 经济元年,是效率主义者的胜利,是投机者的末日。



07没有旁观者



2026 年的春天,全球 AI 战场硝烟弥漫。

阿里「握指为拳」,英伟达「龙虾上桌」(隐喻 NemoClaw 架构),微软、谷歌、Meta、字节、腾讯……所有玩家都在加速奔跑。

这场战争没有银弹,没有捷径,没有一劳永逸的解决方案。它考验的,是组织的韧性、技术的深度、商业的敏锐,以及对「长期主义」的真正信仰。

对从业者而言,这是一个最好的时代:技术红利仍在释放,场景蓝海刚刚打开; 这也是一个最残酷的时代:窗口期正在缩短,试错成本越来越高。

唯一确定的事是:当「Token」成为新本位,所有玩家都必须回答同一个问题——

你,准备好打一场「吨位级」的消耗战了吗?

在这场战争中,胜利不属于声音最大的人,而属于单位 Token 成本最低、场景价值最高、组织效率最快的人。

阿里已经亮剑,英伟达已经铺路。剩下的,看你的了。


推荐活动



「AI+产品创新峰会」即将于2026年4月10-11日在上海举办。峰会旨在以AI为引擎,以产品为载体,打通从技术创新到商业落地的全链路,探索"AI+产品"的融合范式,形成从战略思考到技术实现,从产品创新到商业成功的完整闭环。峰会现场免费龙虾


21-26031P92TJ10.jpg

#第9届AiDD峰会议题征集通道开启,欢迎诸位大咖提交议题,共启AI引领研发新征程,一同重塑研发DNA,定义未来无限可能!


21-26031P92913N7.jpg


返回列表