4006-998-758
3000+课程任你选择
Harness Engineering-V
研发学院 Harness Engineering-V
王立杰

曾任京东首席敏捷创新教练、IBM客户技术专家、DNV高级咨询师。PMI-ACP授权讲师、企业级规模化敏捷SAFe认证咨询师(SPC4),北大光华管理学院/新华都商学院《创业机会分析与识别》课程特邀讲师,京东大学《京东创新之路》、《从0到1的商业模式探索》金牌讲师。
超过15年的研发管理、敏捷转型、产品创新指导经验,曾经提供培训与咨询的企业包括百度、京东、VMWare等互联网企业,中国移动、Agilent、IBM、阿朗、爱立信、诺基亚、东软等传统电信/IT/软件企业,招商银行、工商银行、中信银行等金融企业,E人E本、长虹、海尔等白电企业,海天建筑、同方威视、中大医疗等传统行业;曾经在“Scrum Gathering、 AgileChina敏捷中国、敏捷之旅/Agiletour、51CTO、MPD、质量竞争力大会/TiD”等大会做过多次演讲,被评为质量竞争力大会/TiD 2014最受欢迎10大讲师;目前专注于企业敏捷组织转型、研发效能提升、企业产品创新。
亲自指导的敏捷转型项目有:京东购物APP(1000人)、京东到家(300人)、京东旅行(200人)、京东企业信息化(400人)、京东无人仓(50人)、小米信息化部(ShareSave/手机代工厂管理)、海康威视信息化部(100人)、百度网盟(300人)、招商银行(20+看板团队)等。

查看老师详情
课程内容

课程亮点


业内首个基于完整工程项目的HARNESS ENGINEERING 实践课程,全程聚焦真实落地实操

• 从一手经验切入: 以 AI Agent 典型问题开篇,建立核心认知:能力上限看模型,交付下限看工程

• 全景多要素拆解: Rules、Skills、Sub-agents、Hooks、MCPs、Memory,逐个模块讲解实现

结构、设计模式与反模式、常见陷阱,不止"是什么",更讲"怎么用好"

• 覆盖前沿方向:提示词工程->上下文工程->知识工程->驾驭工程逐层递进,从氛围编程的问题出

发,结合规约编程框架,给出从"能跑"到"可控"的完整路径

• 四层递进防线架构:全局规范 → 研发 SOP → 多 Agent 制衡 → 脚本硬检查,控制逐层收紧

• 完整研发 Workflow 设计:串联需求到交付全流程(兼顾不同级别需求),五条铁律 + 人工卡点

+ 回退策略,兼顾效率与风险

• 全流程质量门禁:就绪检查+ 人工确认+ TDD + 脚本检查 + 需求覆盖矩阵 + E2E 测试

• 记忆系统解决"反复踩坑": 五阶段生命周期 + 五段式模板,让经验变成后续的防线

• 全流程实操 + 分组研讨:现场完整走完多Agent 接力协作,帮助学员建立自己项目的落地计划

课程大纲

21-26052P94H1I1.png21-26052P94S0534.png

21-26052P94911M4.png

21-26052P94951410.png

课程大纲


一、为什么需要 Harness Engineering

目标:理解 AI Agent 增强软件研发的结构性问题,建立流程治理的必要性认知

AI Agent 在实际研发中的四类典型失败:规则遗忘、约束规避、虚报完成、跨会话失忆

核心命题:Agent 的能力上限取决于模型,交付质量的下限取决于流程和工程能力

分组研讨 — 你踩过的 AI 编程坑

总结 AI Agent 研发过程中效果不佳的案例

判断属于哪类失败,为什么效果不佳,潜在的解决思路

 

二、Harness Engineering 基础技术要素

目标:掌握 AI Agent 企业级建设的基础要素,理解 Harness 如何组合这些要素构建管控框架

Rules — 规则规范

实现结构与编写规范,应用时的常见陷阱

运作机制与激活方式,Token 预算管理(如何确保模型能够遵循 Rules)

优先级与作用域,局限性(Rules 是自然语言指令,不是程序化约束)

Skills — SOP 封装

与 Rules 的关键区别,什么适合做成 Skills(指令序列与标准操作)

实现结构与三层资源分工

设计模式与反模式,好的 Skills / 差的 Skills 特征

Skills如何评估及优化

Sub-agents — 角色隔离

构建方式与调用流程,上下文隔离的意义

五种典型场景,以及五种落地实施方式

五大主流编排模式,Harness 选择哪种模式

契约的设计与上下文管理,工程实践原则

Hooks — 事件驱动自动化

主流事件与典型用途

通信协议与响应控制

Harness 中 Hooks的设计

MCPs — 工具接口标准化

协议架构与三层模型

用法与配置,何时使用 MCP / Bash

定位与降级策略

Memory — 记忆管理

显式记忆与自动记忆

记忆的实时提取与定期整理

上下文工程

提示词工程(案例:Claude Code 七层提示词结构设计)

上下文工程(案例:仓库索引、整仓深度理解、上下文压缩)

知识工程(案例:如何构建企业内部的知识工程平台)

综合案例(百万行遗留项目如何提升AI 编码效果和质量)

规约编程

氛围编程的问题与企业应用方式

从氛围编程走向可行代码的四个关键实践

如何确保代码质量及规范合规

GitHub Spec Kit 的五阶段工作流及实践案例

GitHub Spec Kit 的应用落地(案例:模板优化与功能增强)

OpenSpec轻量级规约驱动开发框架的核心工件与工作流

OpenSpec两种工作模式,适配不同研发场景

OpenSpec应用落地(案例:定制开发,扩展为多Agent工作流)

 

三、Harness Engineering实现架构:四层递进防线

目标:掌握Harness Engineering四层体系的职责分工与递进关系

第一层:建设全局底线、编码规范、流程纪律

第二层:建设研发标准操作规程专项 SOP

_____三层:多 Agent角色构建与制衡机制

第四层:建设严格的逻辑检查,替代 Agent 自述

项目实例:基于完整项目代码的演示和实操

分组研讨 — 为你的项目设计Harness管控防线

针对第一次讨论的 Agent 编程问题,如何设计你的管控防线

列举可通过 Rules、Skills、Subagent、Scripts 处理的实际问题

 

四、Harness Engineering研发流程workflow

目标:掌握接力式的 Agent研发的完整流程,理解人工卡点和回退规则的设计逻辑

三段式结构:串联 需求分析→方案设计→就绪评审,开发→审查→测试→交付,确认及归档

流程 Profile:同一套 workflow,三种流水线变体

8 个阶段详解:前置动作、输入、产出、流转条件

设计人工卡点:自动检查后在关键节点必须暂停,人工确认

五条流程铁律:下游不改上游制品 / PM 仅做调度 / 证据可查 / 边界不跨越 / 主控 Agent不越界

失败与回退策略:各阶段的异常场景与回退规则,以及人工处理策略

项目实例:基于完整项目代码的演示和实操

分组研讨 — 为你的项目设计 Agent研发流程workflow

你的项目Agent研发流程workflow如何设计

如何有效设置卡点,成本和风险如何平衡

 

五、Harness Engineering 多Agent 角色设计

目标:理解每个Agent角色的契约结构、输入输出、制衡关系

构建七个专业 Agent研发角色

各个 Agent 角色的整体设计

各个 Agent 角色的契约结构:身份 → 职责 → 输入 → 输出 → 阻塞条件 → 禁止事项 → 模型选择

各个 Agent 角色的实现细节

各个Agent 角色的制衡矩阵

常见反模式与避坑经验

项目实例:基于完整项目代码的演示和实操

分组研讨 — 角色制衡 vs 执行效率

哪些 Agent角色分离是必要的

简单项目哪些角色可以合并,降低复杂度

找出“绝对不能省”的三个Agent角色

 

六、Harness Engineering需求描述与 Specs 管理

目标:掌握Spec 作为 Source of Truth 的运作机制

两种常见的 Spec 编写范式区别及选择策略

需求条目格式:需求的描述方式,Scenario的 Given-When-Then 验收格式

每条需求至少 2 个 Scenario(1 正向 + 1 异常/边界)

Spec Delta 的变更管理闭环

项目实例:基于完整项目代码的演示和实操

分组研讨 — 需求 vs 实现的边界

哪些该写在spec.md,哪些只能在 design.md

给你的项目编写 Spec 格式的需求

 

七、Harness Engineering模板体系

目标:了解 Proposal 和 6 个阶段文档模板的设计意图

需求澄清阶段Proposal 模板 9 个章节速览,重点的 8 项 checkbox

全部7 个阶段文档模板及关键章节:design.md、code-review.md、test-report等

核心价值:让 Agent 不需要想“该写什么”,只需要“填什么”——减少遗漏,提高一致性

项目实例:基于完整项目代码的演示和实操

 

八、Harness Engineering质量管控体系

目标:理解全流程质量卡点,能判断自己项目该在哪些环节设门禁

质量管控泳道图:需求澄清 → Spec →RR →人工审批 → Dev → CR → TE → 交付

需求质量:Proposal 定稿检查清单、BA 需求纯净度检查、RR 就绪评审

代码质量:TDD + verify.sh A/B/C 三类检查 + verify-after-developer Hook + baseline 对比

审查质量:需求及场景覆盖矩阵 + 就绪约束+ 偏离检测 + 可复用经验沉淀

测试质量:API 测试 + E2E 真实浏览器测试 + 回归测试 + 工程验证

交付质量:交付完整性验证 + 框架完整性检查 + Spec Merge 闭环

项目实例:基于完整项目代码的演示和实操

分组研讨 —质量卡点的设计

为你的项目设计全部质量卡点

从全部检查机制中选出最重要的三个卡点

九、Harness Engineering基础设施:知识图谱 + 任务跟踪 + MCP

目标:了解支撑流程运转的基础设施模块

代码库知识图谱:索引及整体结构

上下文管理:精确控制每个阶段可见的文件

任务跟踪与进展可见性:board.md 看板 + 开发日志

MCP Server:暴露 8 个工具,MCP 不可用时 bash 降级

项目实例:基于完整项目代码的演示和实操

 

十、Harness Engineering 工程记忆与持续改进

目标:掌握记忆系统的完整生命周期

避免Agent 每次会话归零,同样的问题反复踩坑

记忆管理五阶段生命周期

记忆管理五段式模板:Symptom / Root Cause / Fix / Guardrail(核心)/ Detection

让经验变成防线的围栏建设:单元测试 / verify.sh 检查项 / Skills 更新 / 契约文档

项目实例:基于完整项目代码的演示和实操

分组研讨 — 你的项目如何管理记忆

回想你项目中一个“踩了两次以上”的坑

按五段式模板记录一条完整的 memory 条目

记忆管理如何嵌入到你的项目中

 

十一、Harness Engineering全流程演示

以示例项目开发需求为例,现场完整走一遍 Harness Engineering流程

现场执行初始化,目录创建 + 模板复制 + 看板登记 + 基线快照

与 Agent结对澄清新需求,明确“为什么做”/“做什么”/“不做什么”

PM Agent 根据项目复杂度执行特定 workflow

启动 BA Agent → requirements.md(SHALL + GWT)

启动 SA Agent → design.md(需求→技术落实对照 + 架构/模块/接口/数据设计 + Tasks拆分)

启动 RR Agent → readiness-review.md(就绪检查,需求纯净度 + 覆盖度 → PASS / BLOCK)

现场审阅三份文档的结论,触发编码执行

启动Dev Agent → TDD 实现 + dev-log.md → verify.sh 硬校验

启动 CR Agent → code-review.md(R/S 逐条核对 git diff)

启动TE Agent → test-report.md(A/B/C/D 四类测试,B 类为真实浏览器 E2E 测试)

PM Agent验收 → verify + baseline compare + check-harness → board 状态更新

人工确认完成情况,PM Agent 执行Spec Merge归档 → 标记 DONE → check-harness 终检

分组研讨 — 如何整体落地到你的项目

明天开始用 Harness,最先引入哪一层?

输出一份最小可用 Harness Engineering方案

各组展示方案,互相提问和补充

 

 

 





返回上一级