4006-998-758
新闻动态

硬核对话:从1000人到1人:AI编程的"规模化陷阱"如何破?

2026-05-29
图片

导语: 当“Talk is cheap, show me the code”逐渐成为旧时代的注脚,软件工程正经历一场静默却剧烈的范式跃迁。过去,一个中型互联网产品可能需要数百名研发、测试、运维人员协同推进;今天,随着AI Agent、Vibe Coding与自动化Harness的成熟,“1个核心人类工程师 + N个AI智能体”的新工作模式正从实验室走向生产线。代码生成的工程带宽已不再昂贵,但验证的成本、安全的边界、组织的架构、虚拟员工的考核,以及复杂遗留系统的平滑演进,却成为横亘在技术理想与工程现实之间的鸿沟。
2026年5月22日,在第九届AiDD峰会上海站一场聚焦“AI原生软件工程”的圆桌对话中,主持人张人杰(KPIT)与来自华为云、腾讯云、行云创新、字节跳动的四位一线技术领袖,围绕人机分工边界、信任与安全机制、组织扁平化变革、AI员工绩效考核、规模化落地路径等核心议题展开了深度拆解。以下为经逻辑重构、语境补充与工程视角延展的完整实录,供所有关注AI编程时代演进的技术管理者、架构师与开发者参考。(全文约17000字,预计阅读时间15分钟)


对话主题:
从1000人到1人:AI编程的"规模化陷阱"如何破?
主持人: 

张人杰:KPIT 中国区CEO

对话嘉宾:

王亚伟:华为云 开发工具效率首席技术专家

薛   锋:腾讯云 天御资深安全架构师

马洪喜:行云创新 CEO

张国强:字节跳动 资深技术专家


SHOWNOTES:

1. 人机分工的边界重构:从“1000人”到“1+N”的工程范式跃迁

2. 信任与验证的博弈:如何驾驭AI的“幻觉”与安全红线

3. 组织扁平化与数字员工考核:AI Native时代的HR革命

4. 规模化落地与产业重塑:巨头、创业公司与开发者的破局之道


图片

正文

图片

01

人机分工的边界重构:从“1000人”到“1+N”的工程范式跃迁


▶主持人张人杰(KPIT): 
今天非常荣幸能与大家共同探讨一个颇具挑战性的话题。随着AI Agent技术加速落地,AI辅助编码已从“尝鲜工具”演变为“基础设施”。过去我们可能有“1000人“在做编程、测试、部署的协同工作,今天我们要深入探讨的核心问题是:当传统千人规模的研发团队演进为”1+N“,“1人 + 多智能体协同”的新型组织模式时,我们将面临哪些结构性挑战?又将迎来怎样的范式机遇?
在正式进入讨论前,请允许我邀请每位嘉宾用约30秒时间简要介绍自己所在机构及核心职责。首先,有请张国强先生。
▶张国强(字节跳动):
感谢主持人。我是张国强,来自字节跳动数据库团队,目前主要负责火山引擎Supabase产品的研发工作,重点聚焦于“Vibe Coding”领域。当前市场上诸多Vibe Coding工具,其底层架构均借鉴或采用了类似BaaS的技术方案。字节在大模型应用层已经积累了大量落地实践,今天也很高兴能和大家分享我们在AI编程场景下的真实踩坑与提效路径。
▶马洪喜(行云创新):
感谢主持人。我是马洪喜,来自行云创新。公司自2016年成立以来,始终深耕企业级云原生和AI原生开发平台。在AI时代到来之前,我们主要基于云原生视角,探索大规模研发团队所需的平台工程体系。进入AI时代,这一平台已演进为“软件工程3.0”背景下的AI原生开发平台。云IDE、AI架构师等能力,均是我们平台核心功能模块的重要组成部分。
去年以来,我们重点推进AI开发与垂直行业的深度融合。一方面,面向金融等具备大规模研发需求的行业,我们的平台可提供标准化支撑;另一方面,我们也积极探索制造业场景,致力于研究AI开发如何与CAD设计、CAE仿真、产品生命周期管理(PLM)等环节实现系统性融合。
以上是我们当前的两大业务主线,期待与在座同行深入交流,谢谢大家。
▶薛锋(腾讯云):
大家好,我是薛锋,腾讯云安全架构师。我的核心工作聚焦于黑灰产对抗、合规咨询以及云安全与大模型安全解决方案的落地实施。简单来说,我的团队核心使命是为AI产业的繁荣发展提供底层安全护航。在AI编码与Agent规模化部署的浪潮中,安全不是附属品,而是前置条件。我们既要帮业务跑得快,更要帮业务跑得稳。
▶王亚伟(华为云):
大家好,我是王亚伟,来自华为云。很高兴参与今天的讨论。
▶主持人张人杰(KPIT):
我也简单介绍一下。我是来自KPIT的张人杰。KPIT是全球头部汽车科技企业之一,在全球拥有约14000名员工。所以今天这个话题对我而言极具现实意义:如果1000人团队能压缩到1人,那14000人就是14人,那我们的组织架构、研发流程、人才结构将发生怎样的地震?
在加入KPIT之前,我曾担任黑莓(BlackBerry)中国区总经理,以及大众集团旗下AI公司的CEO。这段经历使我长期穿梭于技术前沿与商业战略之间,兼具双重视角。
回归今日主题,“从1000人到1人”不仅是规模的缩减,更是范式的重构。当前业界热议的“OPC/ODC”(One-Person Company/Department,一人公司/部门)概念,正是这一趋势的缩影。随着AI Agent的深度落地,我们面临的核心挑战在于如何重新界定人机边界:明确哪些工作由人类主导,哪些交由AI执行,并精准掌控二者协同的比例与节奏。这将是决定转型成败的关键。
接下来,让我们首先有请王亚伟先生分享他的观点。
▶王亚伟(华为云):
初闻“从1000人到1人”这一议题时,我深感震撼。试想,若由单人独立构建如Visual Studio般庞大的系统——涵盖从上层UI、核心模型到底层编译器、.NET框架及多语言支持(C#, TypeScript等),其工作量之巨可想而知。
但思考之后,我认为需对这一命题进行适度修正:从千人规模直接缩减至一人或许尚显激进,但演进为“十人精锐团队”则具备高度可行性。这背后折射出的核心命题,并非单纯的技术迭代,而是组织范式向“AI Native”的深度转型。
回应张总关于“人机分工”的提问,我的观点如下:
首先,在这十人团队中,传统编码工作应被彻底剥离。随着AI辅助技术的成熟,“工程带宽”的成本结构已发生根本性变化——代码生成的边际成本趋近于零,其价值密度显著下降。
其次,真正的核心价值转移至“验证环节”。相较于生成代码,确保代码的正确性、合规性(无法律风险)及安全性(无漏洞隐患)才是高昂且关键的投入。
因此,我建议重构人机协作模式:
1.人类聚焦高价值验证:十人团队应专注于处理涉及法律合规、安全风控等复杂场景的代码审核与决策;
2.AI承担自动化执行:其余所有开发、测试及常规验证工作,均应置于“Harness Engineering(驾驭工程)”框架下,通过构建自动化的沙箱环境与反馈机制,由AI Agent自主完成。
简言之,未来的研发组织将是“人类定义约束与验证价值,AI负责执行与规模化交付”。
▶主持人张人杰:
王总点出了一个非常关键的认知转折。过去创业圈流行一句话:“万事俱备,只差一名程序员。”我们有时也会调侃:“Talk is cheap, show me the code。”,代码被视为最稀缺的硬通货。
然而,在AI时代,这一逻辑发生了根本性逆转:Code is cheap。当代码生成变得触手可及,真正的稀缺资源不再是“实现能力”,而是“定义能力”。因为“Talk”的背后,承载的是极具价值的创意(Idea)、业务洞察与产品构思。
那么,在“代码廉价、创意昂贵”的新范式下,如何确保创意的精准落地与安全合规?接下来,让我们有请薛锋先生从安全与风控的角度,分享他的见解。
▶薛锋(腾讯云):
从安全视角审视,大模型技术在业界的应用已相当成熟。基于当前实践评估,我们可以明确界定AI在安全领域的“可为”与“不可为”边界:
首先,AI可高效承担低风险、高重复性的任务。 例如,面对千万级日志数据或海量告警信息,AI能精准提取特征并进行聚合分析;同时,在常规策略调整及基础黑灰产对抗场景中,AI亦能实现自动化响应,显著释放人力成本。
其次,涉及高危操作与伦理边界的决策,必须保留人工介入。 对于高危命令执行、敏感服务请求等场景,人工判断不可或缺。以典型的“提示词注入”攻击为例,如著名的“奶奶漏洞”(Grandma Exploit):攻击者通过构建情感化叙事(如“过世奶奶哄睡故事”),诱导AI绕过安全围栏输出敏感信息(如Windows激活码)。此类针对大模型逻辑漏洞的社会工程学攻击,目前仍难以完全依赖自动化防御,需依靠人工进行红队测试、内容风控研判及客诉处理,以确保安全底线的稳固。
最后,安全对抗已经不再是单向的,需警惕“攻防不对称”加剧带来的新挑战。大模型技术具有双刃剑效应:不仅安全从业者在用,黑灰产团伙同样利用AI生成钓鱼话术、编写诈骗脚本,导致攻击手段更加隐蔽且规模化。数据显示,黑灰产从业者规模庞大(约300万量级),而持证安全专家仅数十万人,攻防力量严重不对称。因此,在大模型时代,安全工作非但不能做“减法”,反而需做“加法”——既要应对传统风险,更要防范由AI衍生的新型漏洞与对抗形态,构建更具韧性的安全防御体系。安全投入必须前置,而不是事后补救。
▶主持人张人杰(KPIT):
您提到“端到端大模型只有输入输出,中间过程黑盒化”,这确实放大了信任焦虑。过去做自动驾驶,感知、规控、决策、执行各模块可插拔、可检测;现在端到端模型一旦出错,很难定位是哪一层逻辑漂移。马总,作为平台提供方,您如何看待这种信任危机与岗位迁移的连锁反KPIT)应?
薛总所言极是。这让我们联想到自动驾驶技术的演进历程:早期基于“感知-规划-控制”的模块化架构,各环节边界清晰,异常可被精准定位与检测;而当前主流的“端到端”大模型范式,虽提升了整体效率,却因黑盒特性导致中间过程的不确定性难以把控,仅能观测输入与输出。
正如王总与薛总所强调,安全性与可靠性已成为AI落地不可逾越的红线。那么,从创业公司及平台构建者的视角来看,如何在追求极致效率的同时,有效治理这种“端到端”带来的不确定性风险?接下来,有请马总分享他的见解。
▶马洪喜(行云创新):
在听各位分享时,我一直在思考一个本质问题:软件行业的本质是服务业——我们服务的客户可能是车企、金融机构、制造企业,而他们的客户是终端用户。在这一需求链条中,越靠近人类原生需求的环节,产业稳定性越强。例如,出行是人类的刚性需求,因此汽车产业具有极强的韧性;但作为软件服务商,若脱离了对车厂这一中间载体的服务,我们的存在基础便会动摇。
当前,新技术正在推动“软件即服务”向更高效率演进,这不可避免地会重构原有千人团队的岗位结构。这一趋势顺应了国家“十五五”规划中关于“科技创新与产业创新深度融合”的战略导向——即通过AI赋能垂直行业(如智能座舱、工业软件),实现技术价值向产业价值的转化。
在此过程中,一股看不见的力量正在重塑人才格局:一部分人可能因技能错位而被边缘化;另一部分人则被推向更靠近原生需求的核心地带。基于此,我认为未来的千人团队将演化为三类新型角色:
第一类:AI基础设施运维者(The AI Enabler)
这类人员专注于保障AI Coding体系的高效运转。未来IT的核心职责是确保企业级AI开发环境的稳定、安全与合规。虽然需求量缩减,但其战略地位不可或缺。
第二类:跨界融合专家(The Domain-AI Integrator)
这是最具潜力的新兴角色。他们致力于打破AI技术与垂直行业Know-how之间的壁垒。例如,将AI与CATIA、NX、Ansys等工业设计/仿真软件深度融合。传统设计师不懂代码,AI工程师不懂机械原理。今天,市场急需一种“双语人才”:能用AI重构行业Know-how,能把业务逻辑翻译成Agent可执行的Skill,能在设计、仿真、制造链路中打通数据孤岛。这是一种前所未有的职业形态,要求从业者勇敢跳出舒适区,实现“技术+行业”的知识重组。
第三类:业务定义者与需求翻译官(The Business Definer & Requirement Translator)
随着AI工具的低门槛化,甲方企业倾向于收回外包服务,转而自建能力(如同拥有扫地机器人后不再雇佣保洁)。此时,乙方的核心价值从“交付代码”转向“梳理业务”。谁能清晰定义业务逻辑,让AI精准执行,谁就掌握了主动权。这部分人可能脱离传统雇佣关系,转型为小型创业主体(“10人小微公司×100个节点”的分布式形态),以全新的组织形态创造社会价值。
综上,千人团队并非简单消失,而是通过“职能专业化、知识跨界化、组织小微化”的路径,重构为更具活力的新形态。
▶主持人张人杰(KPIT):
马总刚才的分享极具前瞻性,实际上也预判了我后续想探讨的组织演进问题。技术革新必然伴随岗位更替——旧职能消退,新角色涌现。马车夫消失了,但诞生了网约车司机;打字员减少了,但出现了数据标注师与提示词工程师。技术进步终将推动组织架构与上层建筑的深刻变革,并在动态调整中达成新的平衡。
张总,字节在AI应用层布局极深,从抖音推荐算法到豆包大模型,再到扣子(Coze)平台,您如何看待简单应用与复杂系统的分工差异?
▶张国强(字节跳动):
关于“从千人到一人”的演进路径,我认为需基于应用复杂度进行分层讨论:
首先,对于轻量级或标准化应用,“一人团队”已具备高度可行性。当前,以字节跳动“扣子(Coze)”为代表的大模型应用平台,已实现从代码生成到应用构建的全链路自动化。在这类场景中,传统研发角色(如前端、后端、测试)的边界被打破,单人即可借助AI工具完成端到端交付。
其次,对于复杂企业级软件或垂直行业系统,“完全单人化”目前还不成熟,但“人机协同”范式已成定局。在此类高复杂度场景下,核心在于重构人机分工边界:
AI承担标准化执行层:包括代码编写、自动化测试、环境部署等可抽象、重复性高的工程任务;
人类聚焦高阶认知层:专注于架构决策、业务创意、性能调优及复杂逻辑校验等需要深度判断力的环节。
简言之,简单应用趋向“单人全栈”,复杂应用走向“人类定义+AI执行”的深度协同。

02

信任与验证的博弈:如何驾驭AI的“幻觉”与安全红线


▶主持人张人杰(KPIT):
刚才我们探讨了人机分工的边界,这自然引出了一个核心命题:AI自主迭代过程中的“信任危机”。
正如自动驾驶技术虽已进展显著,但公众仍难以完全将生命安全托付给机器,AI在研发领域的自主学习能力同样面临类似的信任鸿沟。如何建立对AI自主进化能力的信任机制,是当前亟待解决的挑战。
以我曾参与的居家养老机器人项目为例,每个家庭的环境数据具有高度异构性。这意味着,当机器人部署到新场景时,必须经历一段“本地化适应期”——通常需数周时间进行数据采集与模型微调。然而,在许多高频或高危场景中,业务往往无法容忍漫长的人工干预周期,必须依赖机器的自主学习与快速迭代。
这就构成了一个两难困境:既需要AI具备高度的自主性以适应复杂场景,又必须确保这种自主性处于可控、可信的安全边界内。
面对这一“自主性 vs 可控性”的信任悖论,企业应如何构建技术与管理双重保障体系?接下来,有请王总从工程实践角度分享他的见解。
▶王亚伟(华为云):
首先,信任的建立源于可控的演进过程。我们可以将AI Agent类比为一名初级工程师(Junior Engineer):通过分配任务、代码审查(Code Review)与持续反馈,它逐渐成长为资深专家(Senior/Principal)。在此过程中,信任度随能力验证而逐步累积,但审查流程与工具链始终不可或缺。
我们必须正视一个前提:Agent在自进化过程中必然伴随“幻觉”与“概念漂移”。因此,讨论的重点不应是“是否会产生错误”,而是“如何构建约束机制以容忍并纠正错误”。
正如人类工程师即便晋升为架构师,仍需遵循代码规范与质量门禁,Agent的治理也需贯穿其全生命周期。我们目前探索的核心方案是“混合验证机制”(Hybrid Verification Framework):
1.模型互验(Model-as-Judge):利用不同大模型进行交叉验证,降低单一模型的认知偏差;
2.人工介入(Human-in-the-Loop):针对薛总与马总提及的高危场景(如安全合规、法务风险、核心代码逻辑),保留最终的人工审批权;
3.确定性工具兜底:借助静态分析、单元测试等确定性工具,确保基础行为的可靠性。
简言之,无论Agent技术如何演进,我们都应将其视为“会犯错的同事”。只要建立起这套“模型互验+人工把关+工具兜底”的混合治理体系,我们便能有效管控自主性带来的不确定性风险,实现真正的“可信自治”。 信任不是盲目交付,而是通过可重复、可审计、可回滚的工程流程逐步建立。
▶主持人张人杰(KPIT):
这就引出了一个关键的经济学悖论:安全合规的“审核成本”是否会抵消自动化带来的“效率红利”?
若为确保绝对安全而引入高强度的人工审核,必然导致人力成本的线性甚至指数级增长。当这部分边际成本不断攀升,极有可能侵蚀AI自动化所释放的生产力价值。
那么,在“极致安全”与“高效交付”之间,我们应如何寻找最优平衡点?有请薛总分享他的见解。
▶薛锋(腾讯云):
短期来看,大模型安全建设确实会引发成本的阶段性激增。无论是语料内容审核、大模型安全网关的部署,还是态势感知体系的构建,初期均需投入大量资源。
然而,若拉长周期观察,我们可以参照过去十年物联网安全与云安全的发展轨迹:尽管初期都伴随设备与人力成本飙升,但从长期来看,安全投入占整体信息化预算的比例通常稳定在10%以内,具备明确的成本边界。
随着技术演进,安全架构正趋向于 “一体化融合”(All-in-One)。例如,新一代安全网关已能同时兼容传统云安全与大模型安全需求,通过技术复用大幅降低边际成本。因此,安全治理的总体拥有成本(TCO)将呈现可控且逐步下降的趋势。
特别是在人工审核环节,我们正通过 “AI反哺安全” 实现成本结构的优化:利用AI模型自动执行策略动态调整、异常数据分析及初级内容过滤,逐步替代传统人力运营。这种“以智治智”的模式,不仅提升了响应效率,更实现了安全运营成本的非线性下降。长期看,安全投入会平滑下降,但防御能力呈指数上升。
▶主持人张人杰(KPIT):
马总,从平台实践看,验证AI结果可信度,与工作属性强相关吗?
▶马洪喜(行云创新):
高度相关。从工程实践来看,AI结果的可信度验证高度依赖于任务属性。
对于线性、单次执行的任务(如工业部件生成或数据处理),我们可通过“结果正确性”反推“过程合理性”,即所谓的“日抛型”验证。然而,对于复杂的中大型软件系统,业务逻辑呈现高分支、强耦合特征,单一的端到端点击测试无法覆盖整体系统的合理性。
因此,我坚持“测试左移”与“需求工程前置”的理念,但需对传统方法进行重构:
1.需求结构化是前提:此前有客户反馈,AI生成的测试用例可用性仅10%。根源在于自然语言需求(如Word文档)包含大量隐性业务规则,AI无法直接解析。必须首先将模糊需求转化为AI可理解的结构化规范(Spec),才能生成高覆盖率的测试用例。
2.平台化治理是保障:若仅关注“生成测试用例”这一单点能力,而忽视需求的丰富化与架构的一致性,便无法确保测试覆盖AI的安全边界。在代码产出量级从“人均百行”跃升至“机器海量”的背景下,传统人工测试模式已失效,必须依托平台化体系实现自动化验证闭环。
更深层次的挑战是Agent间的“传话失真”,多智能体协同中的“误差累积”效应。当Agent A的输出被Agent B消费时,微小的初始偏差会像“传声筒游戏”般被逐级放大,导致最终结果谬以千里。此时,针对单个Agent的人工Debug不仅成本高昂,且难以根除系统性风险。
这引发了一个终极命题:如何管理“虚拟员工”?
AI Agent具有拟人特性(如幻觉即“撒谎”、上下文丢失即“健忘”)。若将Agent视为拥有10名员工的团队,管理者面临的挑战并非技术调试,而是组织治理:如何建立一套可复制的“管理文化”与“约束机制”,管好这些有“健忘”“爱撒谎”“上下文丢失”特性的数字员工?这需要平台化能力与企业治理能力的双重升级。
因此,未来的核心竞争力或许不在于编写代码,而在于构建适配AI特性的组织管理能力与文化范式。
▶主持人张人杰(KPIT):
张总,字节在工程化隔离方面有哪些实践?
▶张国强(字节跳动):
核心是沙箱隔离与灰度验证的工程策略。假设我们用AI写了一个应用并上线,后续要加功能或修Bug。如果直接改完发生产,风险极高。行业通行做法是:计算存储分支管理、线下沙箱跑通验证、自动化回归测试、灰度发布、全量监控。通过严格的工程隔离,把自主迭代的风险控制在可接受范围内。AI再聪明,也不能跳过“测试-验证-灰度-观察”的工程纪律。信任靠流程保障,不靠模型承诺。
1.环境隔离:在计算、存储及网络层面构建独立的测试分支或沙箱环境,确保AI生成的变更在受控空间内运行;
2.线下验证:在非生产环境中充分执行自动化测试与回归验证,确认功能正确性与系统稳定性;
3.渐进式发布:仅在验证通过后,才通过灰度发布机制逐步推向全量用户。

03

组织扁平化与数字员工考核:AI Native时代的HR革命


▶主持人张人杰(KPIT):
随着AI Agent数量激增,规模化协同必然带来通信延迟与上下文丢失。王总,您如何看待多Agent协作的延迟陷阱?组织架构会如何演变?
▶王亚伟(华为云):
在当前的工程实践中,我们尚未遭遇极端的规模化协同瓶颈。这主要得益于我们在“沙箱环境”(Sandbox/Honey Environment)中对Agent角色进行了严格精简与界定。
与传统企业复杂的跨部门审批流不同,我们的Agent协作网络通常仅包含 Developer(开发者)、Reviewer(评审者)、Orchestrator(编排者)及 Supervisor(监督者) 等核心角色,后端依托统一的资源池。这种扁平化结构本质是希望减少跨角色、跨Agent的沟通开销,有效控制了通信复杂度。
针对未来可能出现的规模化挑战,我主张通过以下两种架构策略来优化协同效率:
1. 构建“多能力单体Agent”(Multi-Capable Monolith Agent): 
对于琐碎、高频的微流程,尽量在一个Agent内部实现闭环处理。通过减少跨Agent的交互节点,从源头上消除不必要的通信开销与延迟。
2. 确立“单一职责与边界约束”原则: 
若必须采用多角色协同(如Dev-Review模式),则需严格限定每个Agent的职责边界,禁止其功能发散。一旦Agent角色模糊或沟通网状化,系统将陷入指数级增长的通信复杂度高企,导致严重的延迟与不可控风险。
简言之,“能内聚则内聚,需协同则定界”。通过控制Agent网络的拓扑结构与通信密度,我们才能在规模化落地中保持系统的高效与稳定。
▶主持人张人杰(KPIT):
薛总怎么看这种规模化的陷阱?
▶薛锋(腾讯云):
去年,我们便提出了“AI原生安全”(AI-Native Security) 的核心理念。其核心主张是:安全不应是Agent规模化部署后的“补丁”,而应内置于AI全栈的生命周期之中,实现从“被动防御”向“主动免疫”的范式转变。
具体而言,我们将安全能力深度嵌入研发全流程:
1. 开发阶段:前置大模型框架及第三方开源组件的安全评估,从源头规避供应链风险;
2. 训练阶段:实施语料内容的合规性审查,确保数据输入的纯净与合法;
3. 部署阶段:开展对抗样本分析与Agent漏洞扫描,重点防范提示词注入、强制命令执行等高危风险。
4. 应用阶段:实施应用安全评估,包括api的滥用/泄露,客户端漏洞、用户文件泄露
通过这种 “安全测试内置化” 的模式,我们在保障系统 robustness(鲁棒性)的同时,实现了业务侧、开发侧与用户侧的 “无感安全”——即在不干扰正常流程的前提下,默默筑牢防线。
反观传统企业,安全建设往往陷入 “合规驱动”或“事件驱动” 的被动困境:通常在遭遇业务中断、营销资金被黑产薅取等重大损失后,才被迫回溯整改。这种滞后响应不仅代价高昂,更严重阻碍业务的规模化扩张。
因此,践行 “安全左移” 与 “AI原生安全” 理念,从长远看能显著降低总体拥有成本(TCO),为大规模业务推广提供坚实且低成本的安全底座。
▶马洪喜(行云创新):
主持人提到的“规模化”,我认为应从两个维度审视:一是人类开发者的规模化参与,二是AI Agent本身的规模化部署。这两者交织形成了复杂的协同矩阵。
在降本增效的驱动下,企业可能追求极致的“人机比”(如1人管理1000个Agent),或采纳刚刚亚伟提出的“超级Agent”架构。无论哪种路径,核心挑战在于如何实现可管理的规模化。为此,我们主张将开发活动置于统一的云平台(尤其是中大型企业的私有云)之上,通过云端基础设施实现异构资源与智能体的互联互通与标准化治理,只有“先集成”才“可管控”。
此前,我倾向于“多Agent协作”范式,但亚伟关于“超级Agent”的观点令我耳目一新。若用一种隐喻来类比:
1. 多Agent模式如同“众神体系”,各角色职责专注(Focus),但在复杂链路中,单一节点的错误极易引发严重的连锁反应;
2. 超级Agent模式则类似“上帝视角”,由一个具备全局认知的核心主体统筹调度,减少沟通损耗与误差累积。
▶王亚伟(华为云):
贵,太贵了(笑)
▶马洪喜(行云创新):
事实上,二者并非对立,而是可以融合演进:以“超级Agent”为中枢大脑,下辖若干垂直领域的“子Agent”(Sub-agents)。这种“中心统筹+分布执行”的混合架构,既保留了专业分工的精准性,又通过中央控制降低了系统性风险,或许是未来规模化落地的最优解。
▶主持人张人杰(KPIT):
所以,职能架构的顶层设计至关重要。回顾传统软件工程,QA(质量保证)部门承担着贯穿全生命周期的质量守门职责,确保交付物的整体可靠性。
在AI原生时代,“超级Agent”(Super Agent) 正演变为这一角色的数字化继承者。它不再仅仅是执行者,而是作为全局质量的统筹者与守护者,负责监控子Agent的输出一致性、校验业务逻辑的合规性,并确保多智能体协同链路中的端到端质量。简言之,超级Agent即是AI体系中的“虚拟QA总监”。
▶马洪喜(行云创新):
我非常认同张总关于“超级Agent作为虚拟QA”的观点。在此基础上,我想引入另一个关键维度:“AI人力资源管理体系以及虚拟HR”。
在现实的企业环境中,企业通常不会单一依赖某一种Agent技术或模型,而是根据场景需求组合使用多种工具与底层模型。这种混合架构虽然灵活,但也带来了性能波动与可靠性不一致的挑战——即某些Agent在特定任务中可能表现不佳,甚至产生“不可靠交付”。
这就催生了对“AI绩效管理与淘汰机制”的需求。正如人类组织中的HR部门负责员工的招聘、考核与优化,未来的AI治理体系中也需要引入类似的“数字HR”职能。如果超级Agent是“QA总监”,那么我们需要一套“AI HR系统”以及Agent“HR 总监”来管理这个多元化、动态演进的“数字员工队伍”,确保组织始终由最合适的智能体在最高效地工作。
▶张国强(字节跳动):
关于Agent的规模化演进,我认为当前阶段尚未进入“海量扩张期”,而是处于“少而精”的深耕期。要实现从“精品化”向“规模化”的平滑过渡,核心在于构建层次化与模块化的Agent编排体系。
以AI编程为例,我们可以将传统的软件开发生命周期(SDLC)拆解为设计、编码、测试、部署等独立环节,并为每个环节配置专用的垂直Agent模块。这种模块化架构不仅明确了各Agent的职责边界,还显著提升了协同效率与工程可控性。
简言之,模块化是规模化的基石。只有通过精细化的职责拆解与层级编排,才能确保Agent集群在复杂工程中保持高效、稳定与可扩展。
▶主持人张人杰(KPIT):
承接马总关于组织变革的观点,我想进一步探讨“技术演进对组织架构的重塑效应”。
传统大型企业普遍采用金字塔式科层结构:从C-Level高管、总监、经理层层下沉至一线员工。以我此前任职的大众集团为例,全球近70万员工中,仅核心高管层级便达数百人。这种多层级架构虽便于管控,却也带来了决策链条长、响应迟缓等典型的大企业病。
然而,随着研发范式从“千人团队”向“1+N(人类+智能体)”模式演进,未来的企业组织必将趋向极致扁平化。这一变革在提升效率的同时,也引发了一个严峻的社会命题:中层管理者的职业归宿何在? 当传统的“上传下达”职能被AI代理取代,那些曾处于组织腰部的大量人员将面临结构性失业风险。
马总此前提到了通过技能重塑为其安排新角色,但这仅是微观层面的解法。从宏观视角看,如何系统性应对这一“中层空心化”带来的社会冲击?鉴于在座多位嘉宾来自互联网头部企业,拥有丰富的人才转型实践经验,我想特别请教华为的王亚伟先生:在您看来,企业应如何构建面向未来的组织韧性,以平稳度过这一人才结构的剧烈震荡期?
▶王亚伟(华为云):
这是一个极具挑战性且敏感的议题。华为作为大型科技企业,其组织架构相对纵深,旨在确保“巨轮”在复杂环境中的稳定性与抗风险能力。然而,面对AI驱动的组织变革浪潮,我认为这一转型不仅必然发生,且将以远超预期的速度到来。
针对“中层管理者何去何从”的焦虑,我想分享一个来自Anthropic(前微软同事所在团队)的鲜活案例,其AI原生组织范式值得借鉴:
1. 全员IC化(Individual Contributor):
取消传统意义上的“纯管理岗”(Engineering Manager)。所有角色,包括产品经理乃至设计师,均需具备代码能力(Coder)。管理层不再脱离技术一线,而是通过技术贡献确立领导力。
2. “PR即设计”(PR as Design):
摒弃冗长的设计文档(Design Doc),推行“原型即文档”。优秀的架构设计直接通过Pull Request(PR)或可运行原型呈现,以代码实证替代文字描述,大幅缩短决策链路。
3. 效能度量重构:
不再以“AI生成代码行数”为指标,而是聚焦“PR闭环周期”与“新人上手速度”。这种以交付流速和知识传递效率为核心的度量体系,更能真实反映AI赋能下的生产力跃迁。
结合我自身在微软13年及华为8年的实战经验,我也深刻感受到开发范式的代际差异:传统的“古法编程”依赖人工构建Design Pattern,而在Vibe Coding与Agent辅助下,这些繁琐工作已被自动化取代,开发效率呈指数级提升。
目前,我们的俄罗斯研发团队已在践行这一转型:原本10人的“披萨团队”(Pizza Team),现精简为“2人运维沙箱 + 3-4人构建约束/门禁工具 + 若干人探索前沿研究”的新型结构。剩余人力从重复性交付中解放,转向高价值的创新探索。
综上所述,AI原生组织的转型已非远景,而是正在发生的现实。它要求我们打破科层壁垒,重塑技能模型与度量体系。对于在座的每一位而言,尽早拥抱这一变革,构建适配AI时代的组织韧性,将是未来竞争的关键胜负手。
▶主持人张人杰(KPIT):
王总提到的“效率”一词,让我联想到当前正值企业绩效考核的关键窗口期。传统模式下,我们基于KPI或OKR对人类员工进行多维评估,以此决定薪酬激励与职业晋升。
然而,在“1+N(人类+智能体)”的新型组织范式下,Agent作为“数字员工”同样需要纳入绩效管理体系。正如人类团队需要优胜劣汰,AI集群也亟需建立一套科学的评估与迭代机制。
除了对负责协调的人类管理者进行考核外,我们如何量化数字员工的贡献?如何识别低效或存在风险的Agent并执行“淘汰”或“替换”?这不仅是技术问题,更是管理命题。接下来,有请薛总从安全治理与效能度量的角度,分享他对构建“AI绩效体系”的见解。
▶薛锋(腾讯云):
针对“数字员工”的绩效评估体系,我认为应构建 “合规安全”与“业务实效” 双维度的考核框架:
第一维度:合规与安全底线(Compliance & Security)
这是AI应用的准入红线。我们需要明确量化指标,例如:
undefined 内容合规率:不良语料占比需严格控制在阈值内(如<5%);
undefined 风险敞口控制:高危漏洞与安全风险事件的占比必须趋近于零。 任何突破安全底线的Agent,无论其效率多高,都应被判定为“不合格”。
第二维度:有效消耗与真实价值(Effective Consumption & Real Value)
摒弃单纯以Token消耗量或日活(DAU/MAU)论英雄的粗放模式,转向“去伪存真”的价值评估:
1. 识别无效消耗:区分正常用户交互与黑灰产“薅羊毛”行为。若大量Token被恶意脚本或攻击者消耗,不仅造成资源浪费,更预示系统存在安全漏洞。
2. 打击黑产侵蚀:监控暗网及二手交易平台(如闲鱼、Telegram)上的账号倒卖价格。若官方售价10元的月卡在黑市仅值1元,说明业务已被黑产规模化渗透,这不仅是营销损失,更是严重的风控失效事件。
3. 流量清洗与反作弊:借助全栈式风控引擎,对新增用户进行真实性校验。坚决剔除通过“集体买量”、广告刷量等手段制造的虚假繁荣。营销部门若为完成KPI而引入劣质流量,不仅无法实现商业变现,反而会增加运维成本与安全风险。
简言之,AI绩效评估的核心在于“挤干水分”——通过技术手段清洗虚假流量,确保每一分算力投入都转化为真实的业务价值,而非停留在虚荣指标上。
▶主持人张人杰(KPIT):
马总,行云创新作为平台型创业公司,致力于通过工具赋能客户,践行“授人以渔”的理念。我想请教的是,在向外输出能力的同时,贵司内部是否已率先垂范,落地了“人类员工+数字员工”的混合协作模式?如果已经实施,目前的人机配比大致是多少?如何考核?
▶马洪喜(行云创新): 
行云创新在AI应用领域的探索起步较早,自2020年便已启动相关实践。目前,公司已实现全员深度应用包括编码在内的各类AI智能体,构建了成熟的“人类+数字员工”协同体系。针对刚才的提问,我从两个维度分享我们的实战经验:
第一, 关于中层领导者的角色重塑:从“技术管控”转向“业务驱动”。
正如亚伟所言,中间层的管理职能正在发生深刻变化。对于拥有复杂业务线(如平台服务、工业软件)的企业而言,领导者最核心的能力不再是单纯的技术管理,而是“沟通力”与“交付承诺力”。他们需要具备精准理解客户需求、协调人类与AI资源、并确保按时高质量交付的能力。这些涉及情感智能、商业洞察与资源整合的“非编码技能”,是AI难以替代的人类核心价值。因此,业务型企业的Leader应始终服务于业务本质,而非仅仅关注工具本身。
第二,关于AI员工的考核与选型:遵循“场景适配”与“赛马机制”。
1. 场景化选型(Right Model for Right Job): 如同人类招聘讲究“人岗匹配”,AI模型的选择也需基于任务复杂度。处理日常OA或简单代码生成(Hello World级任务),无需调用高昂的大模型(如GPT-4o);但在挑战高难度领域(如CAD底层算法重构)时,模型间微小的性能差异(如10%的准确率差距)往往具有决定性意义。正如优秀的人类员工能在关键时刻提供颠覆性创意,高性能AI模型在复杂场景下的表现同样不可替代。
2. 内部赛马机制(Internal Horse Racing): 我们在平台上引入了“多模型并行竞争”机制。例如,在构建微服务等关键任务中,系统可同时指派来自不同供应商、基于不同模型的多个AI Agent并行执行。通过对比它们在相同任务下的行为表现、代码质量与效率,我们能够量化评估各“数字员工”的能力边界,从而动态选择最优解。这种数据驱动的选拔方式,不仅提升了任务成功率,也为AI绩效评估提供了客观依据。
简言之,AI原生组织的管理核心在于:让擅长沟通的人类聚焦业务价值,让合适的AI模型匹配特定场景,并通过赛马机制实现持续进化。
▶主持人张人杰(KPIT):
看来,在严苛的绩效评估与“赛马机制”下,“数字员工”面临的生存压力并不亚于人类职场。字节张总怎么看?
▶张国强(字节跳动):
第一,关于组织扁平化与职能重构。 AI提效确实正在重塑工作模式。以我们团队为例,AI的应用边界已从简单的代码片段生成,拓展至复杂的数据库软件构建等高难度领域。这种能力的跃迁必然引发组织结构的调整,但“扁平化”并不等同于“人员冗余”。相反,随着基础编码工作的自动化,被释放的人力将转向更高价值的创造性任务或复杂问题解决。因此,组织变革的本质是职能的升级与重分配,而非单纯的岗位削减。
第二,关于绩效考核的演进:从“复杂量化”走向“结果导向”,甚至最终“去考核化”。 坦诚讲,当前的绩效考核体系往往过于复杂,因为需要精细衡量每个人的手工编码产出。而在AI赋能下,个体效率差异被大幅拉平,绩效表现的区分度反而更加直观和显著——即“谁能更好地驾驭AI解决实际问题”。

04

规模化落地与产业重塑:巨头、创业公司与开发者的破局之道


▶主持人张人杰(KPIT):
我们正身处从“千人规模”向“1+N(人类+智能体)”范式跃迁的关键节点。古人云:“一鲸落,万物生。”当传统工业范式发生结构性变革时,旧有的组织形态虽可能消解,但必将孕育出千千万万个新兴的创新实体。
当前,“AI+X”已成为行业共识——无论是AI+汽车、AI+具身智能,还是AI+低空经济,其本质都是用AI技术重构传统产业的底层逻辑。这对每一位从业者而言,既是适应行业剧变的挑战,也是规划“AI增量”与“原有产业”叠加效应的机遇。
在此背景下,我想特别请教华为王总:对于华为这样拥有数十万员工的巨型组织而言,AI究竟意味着更大的战略机遇,还是更深层次的转型挑战?
过去,企业竞争的核心壁垒往往是“规模效应”。然而,在AI Agent赋能下,一家数百人的初创公司若能有效驾驭智能体集群,是否具备与巨头同台竞技的能力?这种“小团队 vs 大组织”的非对称竞争格局,是所有巨型企业必须直面的严峻考题。
▶王亚伟(华为云):
诚然,机遇与挑战并存,但我认为挑战的严峻性远超机遇。
核心原因在于“个体创新能力的指数级放大”。我们在全球范围内持续招募顶尖人才(Top Talent),观察到年轻一代的思维极具活跃度。在AI工具的赋能下,这种活跃的创意被无限放大,极易催生颠覆性创新。以Cursor等初创团队为例,他们凭借极小的规模与极高的AI杠杆率,正在快速重构开发范式。
对于华为这样在传统领域(如运营商业务)拥有深厚积累的巨型组织而言,最大的风险并非来自同类巨头的竞争,而是来自“降维打击”:一个具备顶级洞察力的个体或小团队,借助AI可能发起破坏性创新,直接动摇我们既有优势领域的根基。
因此,公司高层(EMT)已达成高度共识:变革是唯一的出路。但变革的核心难点在于决心与速度。AI原生组织的转型不仅仅是技术升级,更是对原有流程、架构乃至文化的深层重构。这种重构触及利益深水区,需要极大的政治勇气与管理智慧。
简言之,挑战大于机会,但机会窗口依然存在。胜负的关键,取决于领导层对大势研判的清晰度,以及组织执行变革的决断力与敏捷度。
▶主持人张人杰(KPIT):
腾讯薛总,你们也是超级大公司。
▶薛锋(腾讯云):
在我看来呢,机遇大于挑战。这一判断主要基于“技术迭代”与“合规驱动”双轮驱动的视角:
第一, 新风险倒逼安全技术体系的代际升级。
大模型引入了提示词注入、越狱攻击、数据投毒及语料污染等前所未有的安全威胁。这些挑战并非单纯的阻碍,而是推动安全产品与技术进化的核心动力。为此,我们迅速推出了Token防滥用机制、大模型安全网关、态势感知平台及应用级安全评估体系,实现了从传统网络安全向AI原生安全的范式跃迁。
第二, 合规体系完善释放巨大的市场红利。
随着国家关于生成式人工智能服务相关法规的落地,以及大模型备案标准的规范化,行业正从“野蛮生长”走向“有序发展”。合规要求的明确,不仅为企业提供了清晰的操作指南,更直接带动了安全预算的增长:
预算倾斜:企业为满足合规要求,显著增加了对AI安全解决方案的投入;
生态共建:促进了产学研深度融合,加速了校企合作与专业人才培养
简言之,黑灰产对抗在获得合规加持后,已从单纯的技术博弈升级为“技术+合规+生态”的系统性工程,起到了很好的正向循环的作用。
▶主持人张人杰(KPIT):
马总作为创业公司,是否有不一样的看法。
▶马洪喜(行云创新):
AI引发的变革绝非局限于软件行业的技术迭代,而是一场跨行业的全要素生产力重构。其影响具有普遍性与渗透性,只是不同行业的感知存在“时滞”。
首先,冲击已溢出IT边界,重塑实体劳动力结构。 以影视产业为例,AI生成技术(AIGC)已对传统制作流程产生颠覆性冲击,大量基础角色被数字人替代;AI生成的短片在质感与效率上甚至已展现出超越人类演员的趋势。同样,在制造业核心环节(如设计、仿真),AI的深度介入正在改写CAD/CAM工程师的工作范式。这些案例表明,AI正在重构全社会的价值链分布。
其次,历史视角下的“技术性失业”焦虑往往被夸大。 正如马车夫曾担忧火车的发明,每一次技术革命都会引发短期的就业恐慌。但拉长历史周期看,人类社会正是在这种“破坏-重建”中螺旋上升。当下的焦虑,在未来回望时或许只是多虑。
最后,新质生产力必然催生新岗位与新物种。 以数控加工领域为例,传统CNC技术长期由西门子等巨头垄断,技术形态相对固化。然而,随着桌面级数控设备与3D打印技术的成熟,一种全新的制造品类正在崛起。这种技术民主化不仅降低了制造门槛,更可能衍生出数千个新型就业岗位。
因此,我们不应仅盯着“消失的岗位”,更应关注“被催生的新生态”。AI带来的不仅是替代,更是创造——它正在打开一个充满无限可能的增量市场。
▶张国强(字节跳动):
关键在于适应变化。从业者需从单一专业向更广业务视角拓展,探索AI未覆盖的未知领域。工具会爆炸,Hype会褪去,唯有保持学习敏捷性,紧跟业务价值主线,才能立于不败之地。

结语:一鲸落,万物生


从“1000人”到“1+N”,不是简单的效率跃升,而是工程范式、组织形态、产业逻辑的系统性重构。代码廉价化,验证贵族化;Agent拟人化,管理文化化;组织扁平化,考核结果化;安全左移化,合规前置化。面对AI浪潮,悲观者看到岗位流失,乐观者看到价值迁移。一鲸落,万物生。旧模式解体,新生态破土。

对于技术管理者,请加速向AI Native组织转型,废除冗长文档,用PR说话,以闭环周期与新人上手速度为尺; 对于架构师,请构建混合验证体系与Benchmark系统,把Agent当同事,用流程约束幻觉; 对于开发者,请拥抱Vibe Coding,但守住工程纪律;跨界学习行业Know-how,成为业务与AI的翻译官; 对于企业,请将安全内置全生命周期,用赛马机制优选AI员工,用结构化需求喂养智能体。

技术不会等待犹豫者,产业不会奖励守旧者。保持开放,快速进化,敬畏工程本质。在万域新生的时代,唯有主动重构者,方能把握先机。


*观众提问
Q:各位嘉宾好,我有两个关于AI落地实践与个人成长的困惑,想请教各位专家:
第一, 关于复杂存量系统的AI改造路径。
对于新建项目或小型工具,利用现有开源/闭源Agent工具实现AI闭环相对容易。然而,对于已部署多年、微服务架构极其复杂的传统存量业务系统,如何实现端到端的AI化重构面临巨大挑战。请问,针对这类“重资产”系统,是否存在可参考的最佳实践或分阶段演进路线图?从哪个切入点着手能最大程度降低风险并确保成功?
第二, 关于技术焦虑与工具选型评判。
在AI技术爆炸式增长的背景下,开发者面临着双重压力:
方向迷茫:面对层出不穷的新工具与新范式,应如何平衡“追逐前沿技术(如Agent开发)”与“深耕业务领域知识”之间的精力分配?
评估困境:当前市场上存在大量过度营销的AI工具,宣传效果与实际落地能力存在显著落差(Expectation Gap)。在缺乏充分试错成本的情况下,开发者应建立怎样的评估框架或标准,以理性甄别工具的真实价值,避免被误导?
感谢各位老师的解答。
A:王亚伟(华为云):
针对您提出的两个核心问题——复杂微服务系统的AI化改造路径与开发者的技术焦虑与工具选型,我结合团队实战经验分享以下观点:
一、 关于复杂存量系统的AI改造:从L2向L4演进的系统工程
首先需明确,Vibe Coding在小型工具或插件开发中已非常成熟,但在处理高耦合、多微服务的复杂系统时,确实面临上下文理解不足、生成代码语义错误等挑战。这本质上是软件工程从L2(辅助编码)向L4(高度自治)跃迁的过程,绝非单纯引入工具即可实现,而是一项系统性工程。
建议采取“分步走、务实推进”的策略:
1. 全员普及与认知对齐(Play First):
组织转型的第一步是消除技术陌生感。要求团队成员熟练掌握主流AI Coding工具(如Cursor、Trae、CodeBuddy等),通过“玩起来”建立直观认知,打破心理壁垒。
2. 责任田机制与局部突破(Pilot & Scale): 
实行“微服务责任田”制度,由各模块负责人牵头,探索AI在特定业务场景下的提效路径。通过小范围试点验证可行性,再逐步推广至全系统,降低试错成本。
3. 构建定制化Skill与工具链(Customization): 
AI无法直接理解复杂的私有业务逻辑。团队必须开发专属的Skill(技能包)与配置规范,让Agent能够调用内部工具、遵循业务约束。这是一个将“通用智能”转化为“领域智能”的关键过程。
4. 建立基准测试体系(Benchmarking): 
正如马总所言,评估Agent优劣不能仅凭感觉。需构建多维度的Benchmark System,从代码质量、通过率、响应速度、Token成本等指标量化评估不同模型/Agent在特定业务下的表现。只有经过数据验证的工具,才值得大规模引入。
5. 解决方案构建者转型(Solution Builder): 
最终,开发者需从“代码编写者”转型为“AI解决方案构建者”。不仅要使用工具,更要围绕核心模型(如GLM系列)开发独立的辅助工具与中间件,形成闭环的工程化能力。我们团队在探索“Dev-Review”自动化闭环时,经历了大量痛苦的试错与迭代,因为AI的黑盒特性决定了其可解释性弱,唯有通过不断的“尝试-反馈-优化”循环,才能找到最优解。
 二、 关于技术焦虑与工具选型:回归价值本源
面对海量新工具的涌现,建议保持“定力”与“批判性思维”:
1. 拒绝盲目追逐,聚焦业务价值: 
不要陷入“工具军备竞赛”。无论Agent如何进化,其核心价值在于解决实际问题。应优先关注那些能显著降低边际成本、提升交付质量的工具,而非仅仅追求“新奇”。
2. 建立独立评估框架: 
对于市场上过度营销的工具,切勿轻信宣传。应通过小规模PoC(概念验证)进行实测,重点考察其在真实业务场景中的鲁棒性与集成难度。若工具无法融入现有工作流,即便功能再强大也是负担。
3. 深耕领域知识(Domain Know-how): 
AI可以替代重复性编码,但无法替代对业务逻辑的深刻理解。因此,“深耕业务系统”与“学习Agent技术”并非对立,而是互补。未来的核心竞争力属于那些既懂AI工具链,又深谙行业痛点的双重人才。
简言之,AI落地是一场马拉松,而非短跑。拥抱变化,但保持理性;大胆尝试,但严谨验证。唯有通过持续的工程化实践与组织适配,才能在不确定性中找到确定的增长路径。



下一站预告




变革之路注定艰难,但先行者从不独行。如果你已准备好不再旁观,如果你渴望遇见那些同样躬身入局、拥抱 AI 且亲手“手搓代码”的同行者——欢迎来8月21-22日 AiDD峰会北京站 ,一起成为这场范式重构的参与者与制定者,一起定义 AI 时代的技术领导力。
图片


返回列表