
——基于第9届 AI+研发数字峰会(AiDD 2026 上海站)的系列观察报道(6)
▼
很多企业第一次用 AI 写代码、写文档、查资料时,都会经历一个兴奋时刻:原来一段提示词,就能把过去半天的工作压缩到几分钟。
但兴奋很快会遇到第二个问题:这次跑通了,下次还能复用吗?这个人的经验,能不能给团队用?一个 Agent 在某个项目里学到的上下文、流程和踩坑记录,能不能沉淀下来,变成组织下一次交付的起点?
这正是本届 AiDD 上海站多场分享共同指向的深层变化。AI 落地正在从“单次调用模型”转向“持续建设资产”。企业真正的护城河,不只是采购了哪个大模型,也不是某个工程师写出了一条神奇提示词,而是能不能把业务知识、流程经验、工具调用、评测标准和最佳实践,沉淀成 Agent 可以持续调用、团队可以共同演化的组织资产。
TiDB 副总裁刘松在《百万 Agent 时代的原生记忆体与数据基础设施》中,把企业智能化拆成一个更完整的结构:大模型、数字资产、数字员工共同构成铁三角。这个判断很关键,因为它把“AI 能不能做事”的问题,从模型能力本身,推进到了企业是否具备可被 Agent 使用的数据和记忆基础。
过去,企业数字化资产主要服务人:文档给人看,工单给人查,SOP 给人执行,会议记录给人回忆。进入 Agent 时代以后,这些资产的使用者发生了变化。数据库、知识库、代码仓库、工单系统、即时通讯和在线文档,不再只是人的查询对象,也会成为 Agent 理解任务、拆解步骤、调用工具和复盘结果的上下文来源。
因此,企业 AI 提效的起点不是“让每个人都装一个工具”,而是让组织已有的知识真正流动起来。刘松提到,Agent 如果缺少持久记忆和共享经验,就容易从“工具”退回“玩具”:一次任务能跑通,但下一次仍然像第一次一样从零开始。

图 1:刘松《百万 Agent 时代的原生记忆体与数据基础设施》:大模型、数字资产与数字员工构成企业智能化铁三角(PPT 第 9 页)

图 2:刘松《百万 Agent 时代的原生记忆体与数据基础设施》:持久记忆让个人经验沉淀为企业知识资产(PPT 第 19 页)
腾讯 PCG 工程效能平台部刘琮玮在《AI 原生知识库及其实践与应用》中,把知识库的角色讲得更进一步:知识库正在从被动存储,走向主动赋能。它不只是把文档放进去等人搜索,而是要解决知识从哪来、怎么处理、怎么用、如何持续提升质量的问题。
这和传统知识库的差别很大。传统知识库的核心体验是“人找知识”:人输入关键词,系统返回文档,人再判断哪一段有用。AI 原生知识库则要服务“Agent 用知识”:它要能把知识拆分、建模、关联、召回、验证,再把结果交给上层任务流。换句话说,知识库从资料柜,变成了 Agent 的工作接口。
刘琮玮的分享中,知识库建设被分成“筑基石、炼真金、结智网、开繁华”几个层次。这里最值得企业关注的,是“炼真金”和“结智网”:前者意味着不是所有资料都天然有价值,必须经过清洗、结构化和能力化;后者意味着知识之间要有网络关系,才能支持复杂问题的定位、推理和组合调用。
当知识库开始承担这种角色,企业就不能只用“上传了多少文档”来衡量它。更重要的指标会变成:Agent 能不能找得到,找得准不准,用完以后结果是否可验证,错误能否回流,知识是否会更新。这也是知识库从信息系统变成组织能力基础设施的分水岭。

图 3:刘琮玮《AI 原生知识库及其实践与应用》:AI 原生知识库建设方案与分层架构(PPT 第 12 页)

图 4:刘琮玮《AI 原生知识库及其实践与应用》:知识库应用分层构建方案,包含 Skill、网关、导航、执行与数据层(PPT 第 20 页)
如果说知识库解决的是“组织知道什么”,记忆工程解决的就是“Agent 经历过什么、学会了什么、下次能不能少走弯路”。
记忆张量应用算法负责人唐波在《从记住到学会:MemOS 记忆工程的技术实践与系统思考》中,用“从记住到学会”概括了 Agent 时代的记忆问题。传统对话记忆更多关注用户偏好和上下文补全;执行型 Agent 的记忆对象则完全不同,它要记录任务目标、工具调用、执行过程、错误日志、修复路径、用户反馈和最终结果。
这类记忆如果只停留在对话摘要里,价值很有限。真正有价值的是把任务过程加工成长期能力:哪些步骤有效,哪些工具该用,哪些错误会反复出现,哪些判断需要人审核,哪些流程可以抽象成 Skill。唐波提到的记忆抽取、组织、检索、更新、共享,本质上是一套让 AI 经验可管理、可调用、可演化的操作系统。
这也是为什么“记忆”不能只被理解为更长上下文。更长上下文只是把更多材料塞进模型窗口;记忆工程则要回答材料如何进入、如何去重、如何溯源、如何权限控制、如何在团队间共享、如何变成可复用技能。前者解决临时输入问题,后者解决长期复利问题。

图 5:唐波《从记住到学会:MemOS 记忆工程的技术实践与系统思考》:记忆增强层需要具备抽取、组织、检索、更新与共享能力(PPT 第 16 页)

图 6:唐波《从记住到学会:MemOS 记忆工程的技术实践与系统思考》:Mem2Skill 将对话碎片沉淀为结构化任务和参数化技能(PPT 第 32 页)
去哪儿旅行基础架构负责人、技术总监李佳奇在《去哪儿旅行 L3 AI Coding 的研发平台与 Skills 实践》中,给出了一个研发组织里的典型样本。去哪儿不是只看某个工程师有没有用 AI 写代码,而是围绕研发数字化、AI Coding 工具和自动化流水线,持续沉淀可复用 Skills。
这类 Skills 的意义,不是把提示词整理得更漂亮,而是把“怎么完成一类任务”的经验封装起来。比如一句话需求自动化开发、自动调试和部署、性能自动优化等能力,背后都不是单次问答,而是流程、工具、上下文和验证标准的组合。
李佳奇分享的 AI Coding Skills 市场和管理流程,代表了一种组织级 AI 落地方式:先把有效实践沉淀成 Skill,再通过市场、流程和数据体系让它被发现、被复用、被治理。这样,AI 能力不再依赖少数高手的个人经验,也不只是散落在聊天记录里的技巧,而是进入组织可管理的资产池。
企业做 AI Coding 时,往往容易盯着出码率。但从长期看,出码率只是过程指标。更值得追问的是:那些高质量交付路径有没有被沉淀?重复任务有没有形成 Skill?失败案例有没有转成规则、评测或护栏?新同事和新 Agent 能不能站在已有经验上开始工作?

图 7:李佳奇《去哪儿旅行 L3 AI Coding 的研发平台与 Skills 实践》:AI Coding Skills 沉淀,把研发实践变成可复用能力(PPT 第 38 页)

图 8:李佳奇《去哪儿旅行 L3 AI Coding 的研发平台与 Skills 实践》:AI Coding Skills 管理流程,让技能进入组织治理体系(PPT 第 40 页)
阿里云技术专家在《Agentic Skill 在阿里云 ECS 大规模诊断中的实践与落地》中,用运维诊断场景把这一点讲得很具体。ECS 运维里存在大量长尾问题,规则引擎太死,纯 LLM 又太活。Agentic Skill 的价值,就是把专家经验编码成可执行框架:触发条件、诊断逻辑、工具白名单和执行约束先被确定下来,具体路径再交给 LLM 灵活判断。
更重要的是展示了“存量知识如何变成 Skill”的工程流程:从已解决工单中提取诊断路径,经过 LLM 初步生成、专家 Review、历史案例回放、灰度验证,再进入线上使用。这个流程说明,组织资产不是靠一次整理文档完成的,而是在真实任务、专家校验、评测验证和生产反馈之间不断循环。
支付宝架构师高梦飞在《让智能体可观察、可评估、可进化》中,则从评测和可观测角度补上了另一半闭环。Agent 上线后,知识库不是静态的。Badcase 要能被发现,错误要能被归因,缺失知识要能自动补全,过期知识要能巡检淘汰。只有这样,知识库才会从“资料集合”变成“自进化系统”。
这一点对企业尤其关键。AI 资产如果不能评测,就无法治理;不能治理,就无法复用;不能复用,就很难产生复利。真正成熟的 AI 组织,不只是会把知识喂给模型,而是会让每一次执行都产生新的证据、经验和改进信号。

图 9:《Agentic Skill 在 ECS 运维中的实践》:存量知识通过工程流程转化为可执行 Skill(PPT 第 21 页)

图 10:高梦飞《让智能体可观察、可评估、可进化》:基于数据的进化闭环构建自进化知识库智能体系(PPT 第 35 页)
从这些分享可以看到,企业 AI 落地正在进入一个新的阶段。第一阶段是“能不能用 AI 完成任务”,第二阶段是“能不能把任务做稳”,再往后,就是“能不能把每次任务留下来的经验变成下一次的起点”。
知识库、记忆工程和 Skills,表面上是三类技术或工具,底层其实回答同一个问题:组织如何让 AI 能力不随一次对话结束而消失。知识库让业务事实可调用,记忆工程让过程经验可延续,Skills 让最佳实践可执行,评测和可观测让这些资产持续变好。
这也是企业 AI 能力从一次性使用变成持续复利的关键。模型能力会持续进步,工具形态会不断变化,但真正能在组织内部越积越厚的,是那些被结构化、被验证、被复用、被治理的知识和经验。