
—— 一边是论文数量与质量的巅峰对决,一边是对Agent落地ROI的极致验证。
一边是论文数量与质量的巅峰对决,一边是对Agent落地ROI的极致验证。
表面看,AI正高歌猛进;
实则,一场“泡沫预警”正在业内悄然蔓延。
就在re:Invent现场,一位硅谷工程师苦笑着说:
“如果你和每个做Agent的展商干杯,走一半你就醉了——哪怕他们根本没做出能跑的Agent。”
而数据库公司PingCAP CTO黄东旭更直言:
“我要来泼冷水:Agent的基础设施还很薄弱。”
这盆冷水,不是泼向AI的未来,而是浇醒那些只看到“智能体”幻象、却忽视工程根基”的狂热者。
01
NeurIPS 2025:中国科研的“量变到质变”
NeurIPS 2025的数据,揭示了一个清晰趋势:中美AI双极格局已固化。
总量上:清华大学以390篇接收论文,微弱优势超越Google(388篇);
质量上:在Oral + Spotlight(顶级论文)中,Google以72篇反超清华(65篇),但差距仅7篇。

The New Map of Frontier AI Research at NeurIPS 2025
这说明什么?
清华赢在广度,Google赢在高度。
Google 的份额从全量的 2.17% 提升至 2.82% (72 篇),反超清华夺回第一。这说明在定义 SOTA 的突破性工作上,DeepMind 与 Google Brain 依然具备极强的竞争力。
清华在高质量榜单上并未掉队,份额提升至 2.54% (65 篇),稳居全球第二。
更值得关注的是,全球 AI 研究正形成清晰的“三城记”格局:
旧金山湾区:Google、Meta、Stanford、Berkeley 构成技术-资本-人才闭环;
北京:清华、北大、国科大以高校集团军驱动基础创新;
上海:上海交大、复旦、上海 AI Lab 正快速崛起为“第三极”,三者合计在 Top 50 榜单中份额高达 7.3%,足以与湾区、北京并列。
这标志着,中国 AI 不再只是“北京一枝独秀”,而是双核驱动、三极并立的新生态正在成型。
中国已从“科研数量优势”迈向“核心突破能力”的临界点。
更关键的是,技术赛道正在迁移:
LLM红利见顶:传统大模型论文增长放缓;
RL & Robotics爆发:相关论文达2302篇,年增39.4%;
中国增速惊人:在RL领域份额达29.9%,增速81.1%,直逼美国(32.1%);
NLP重心东移:中国在自然语言处理领域论文占比33.8%,首次超过美国(31.4%)。
这意味着:
AI的战场,正从“语言模型”转向“具身智能”——从屏幕里的聊天,走向物理世界的行动。
正如NeurIPS新增的“立场论文”(Position Paper)所暗示:
AI已不仅是技术问题,更是社会、制度与伦理的系统工程。
欧洲正押注“可解释AI”(Explainable AI),美国聚焦“超级智能”,而中国,则在工程化落地(如RL、Agent、AI for Science)上全力冲刺。
02
re:Invent 2025:Agent不是魔法,而是“数字员工”
如果说NeurIPS是“未来方向”,那么re:Invent就是“当下答案”。
亚马逊云科技CEO Matt Garman的判断斩钉截铁:
“Agentic AI正处于关键转折点——从‘技术奇迹’变为‘实用工具’。”
大会展示的案例,无不指向一个事实:Agent的价值,在于解决“旧问题”而非创造“新概念”。
索尼:用Agent将合规审查效率提升100倍;
S&P Global:新应用部署从“几周”压缩至“几分钟”;
Amazon Transform:自动迁移大型机代码,消除70%维护成本;
Kiro Agent:6人76天完成原需30人18个月的项目。
这些不是Demo,而是已跑在生产环境中的“数字员工”。
亚马逊的Agent三大特征,也定义了真正的Agentic AI:
1.自主决策:能理解任务目标,自主规划步骤;
2.横向扩展:可调用多工具、多API协同;
3.长时运行:支持复杂、多轮、跨会话任务。
但亚马逊没说的是:这一切,建立在全栈工程能力之上——
从Trainium 3/4自研芯片(每兆瓦token输出提升5倍),
到Nova 2 Omni多模态模型,
再到AgentCore安全框架(确保金融级合规)。
Agent不是空中楼阁,而是地基之上的高楼。
03
泼冷水的人:Agent的三大“致命短板”
36氪采访的多位美国开发者直言:
“市面上的软件,根本没做好被Agent调用的准备。”
这背后,是Agent落地的三大现实困境:
Pokee.AI CEO朱哲清公开表示:
“AI Agent的成本,80–90%都在推理。若不能将推理成本打下80%,就不可能盈利。”
VC已开始追问每家Agent初创公司:
“你的订阅费,能cover推理成本吗?”
这意味着:Develop for Cost(为低成本开发),正成为新竞争力。
Anthropic产品负责人指出:
“AI讨厌数据孤岛。当它面对几十个API、分散的权限、不一致的UI,注意力一分散,就‘智力下降’。”
当前软件架构,是人类中心主义的产物:
Agent需要的,是一套“AI-first”的软件革命——
比如,为AI设计类似SQL的交互语言,统一任务调度协议。
豆包手机助手刚发布,就被微信封杀;
字节与头部手机厂商谈判破裂,因对方“不愿开放系统权限”。
为什么?
因为Agent一旦失控,后果远超聊天机器人——它能转账、删数据、发消息、签合同。
亚马逊的解法是AgentCore:提供可观测性、控制策略与行为审计,确保每一步可追溯、可回滚、可问责。
但大多数初创公司,连基础监控都没有。
04
真正的胜负手:从“模型能力”到“工程体系”
NeurIPS与re:Invent的对比,揭示了AI下半场的真实规则:

未来属于谁?
亚马逊之所以敢说“数十亿Agents将重构产业”,
是因为它已构建从芯片→模型→Agent→行业解决方案的全栈能力。
而OpenAI、Google、字节、蚂蚁,也都在构建自己的“工程护城河”:
OpenAI:通过企业API深度集成到微软生态;
Google:靠Android + Workspace + Search,实现Agent分发;
字节:用豆包手机助手,抢占“系统级AI入口”; (文章参考:豆包手机实测爆火又翻车:我们离「意图操作系统」,还差一场范式革命)
蚂蚁:以“灵光”降低创造门槛,让普通人“一句话造应用”。(文章参考:灵光一闪,蚂蚁用「Vibe Coding」撕开 AI 原生产品的下一战场)
NeurIPS告诉我们:AI的创新引擎,正从硅谷向北京、上海迁移;
re:Invent证明:AI的价值,不在参数多大,而在落地多深;
美国AI春晚的那盆“凉水”,则提醒我们:Agent不是魔法,而是需要十年磨一剑的工程硬仗。
未来的胜负,不在于谁喊出“通用智能体”的口号,
而是那些把“灵光一闪”,变成“可运行系统”的人。
技术从不温柔,但它永远奖励脚踏实地的人。
Agent 的夏天,或许刚被一盆凉水浇醒;
但真正的建造者,本就不靠热度,而靠深度。
参考资料:
NeurIPS 2025 OpenReview 全量数据分析
re:Invent 2025 官方发布会实录
《美国AI春晚,一盆凉水浇在Agent身上》(36氪)
欢迎转发、点赞、在看——看清AI落地的真实战场。
下一站预告
#AI+产品创新峰会· 2026上海站