HARNESS ENGINEERING

研发学院 HARNESS ENGINEERING

张乐

曾任职惠普、埃森哲等全球TOP外企，国内一线互联网公司

曾任百度云、百度金融事业部敏捷与DevOps转型的主导者

超过十五年敏捷转型、工程效能提升和大型项目管理实践经验，积累了丰厚的知识体系和众多一线案例

曾主导数百人团队实施DevOps转型，在保证质量的前提下发布频率提高数倍

在业界积极推动DevOps方法和技术，发布『DevOps道法术器』体系化实施框架

设计并实现端到端持续交付流水线工具落地解决方案

查看老师详情

课程内容

课程亮点

• 业内首个基于完整工程项目的HARNESS ENGINEERING 实践课程，全程聚焦真实落地实操

• 从一手经验切入：以 AI Agent 典型问题开篇，建立核心认知：能力上限看模型，交付下限看工程

• 全景多要素拆解： Rules、Skills、Sub-agents、Hooks、MCPs、Memory，逐个模块讲解实现

结构、设计模式与反模式、常见陷阱，不止"是什么"，更讲"怎么用好"

• 覆盖前沿方向：提示词工程->上下文工程->知识工程->驾驭工程逐层递进，从氛围编程的问题出

发，结合规约编程框架，给出从"能跑"到"可控"的完整路径

• 四层递进防线架构：全局规范 → 研发 SOP → 多 Agent 制衡 → 脚本硬检查，控制逐层收紧

• 完整研发 Workflow 设计：串联需求到交付全流程（兼顾不同级别需求），五条铁律 + 人工卡点

+ 回退策略，兼顾效率与风险

• 全流程质量门禁：就绪检查+ 人工确认+ TDD + 脚本检查 + 需求覆盖矩阵 + E2E 测试

• 记忆系统解决"反复踩坑"：五阶段生命周期 + 五段式模板，让经验变成后续的防线

• 全流程实操 + 分组研讨：现场完整走完多Agent 接力协作，帮助学员建立自己项目的落地计划

课程大纲

一、为什么需要 Harness Engineering

目标：理解 AI Agent 增强软件研发的结构性问题，建立流程治理的必要性认知

• AI Agent 在实际研发中的四类典型失败：规则遗忘、约束规避、虚报完成、跨会话失忆

• 核心命题：Agent 的能力上限取决于模型，交付质量的下限取决于流程和工程能力

分组研讨 — 你踩过的 AI 编程坑

• 总结 AI Agent 研发过程中效果不佳的案例

• 判断属于哪类失败，为什么效果不佳，潜在的解决思路

二、Harness Engineering 基础技术要素

目标：掌握 AI Agent 企业级建设的基础要素，理解 Harness 如何组合这些要素构建管控框架

Rules — 规则规范

• 实现结构与编写规范，应用时的常见陷阱

• 运作机制与激活方式，Token 预算管理（如何确保模型能够遵循 Rules）

• 优先级与作用域，局限性（Rules 是自然语言指令，不是程序化约束）

Skills — SOP 封装

• 与 Rules 的关键区别，什么适合做成 Skills（指令序列与标准操作）

• 实现结构与三层资源分工

• 设计模式与反模式，好的 Skills / 差的 Skills 特征

• Skills如何评估及优化

Sub-agents — 角色隔离

• 构建方式与调用流程，上下文隔离的意义

• 五种典型场景，以及五种落地实施方式

• 五大主流编排模式，Harness 选择哪种模式

• 契约的设计与上下文管理，工程实践原则

Hooks — 事件驱动自动化

• 主流事件与典型用途

• 通信协议与响应控制

• Harness 中 Hooks的设计

MCPs — 工具接口标准化

• 协议架构与三层模型

• 用法与配置，何时使用 MCP / Bash

• 定位与降级策略

Memory — 记忆管理

• 显式记忆与自动记忆

• 记忆的实时提取与定期整理

上下文工程

• 提示词工程（案例：Claude Code 七层提示词结构设计）

• 上下文工程（案例：仓库索引、整仓深度理解、上下文压缩）

• 知识工程（案例：如何构建企业内部的知识工程平台）

• 综合案例（百万行遗留项目如何提升AI 编码效果和质量）

规约编程

• 氛围编程的问题与企业应用方式

• 从氛围编程走向可行代码的四个关键实践

• 如何确保代码质量及规范合规

• GitHub Spec Kit 的五阶段工作流及实践案例

• GitHub Spec Kit 的应用落地（案例：模板优化与功能增强）

• OpenSpec轻量级规约驱动开发框架的核心工件与工作流

• OpenSpec两种工作模式，适配不同研发场景

• OpenSpec应用落地（案例：定制开发，扩展为多Agent工作流）

三、Harness Engineering实现架构：四层递进防线

目标：掌握Harness Engineering四层体系的职责分工与递进关系

• 第一层：建设全局底线、编码规范、流程纪律

• 第二层：建设研发标准操作规程专项 SOP

• 第三层：多 Agent角色构建与制衡机制

• 第四层：建设严格的逻辑检查，替代 Agent 自述

• 项目实例：基于完整项目代码的演示和实操

分组研讨 — 为你的项目设计Harness管控防线

• 针对第一次讨论的 Agent 编程问题，如何设计你的管控防线

• 列举可通过 Rules、Skills、Subagent、Scripts 处理的实际问题

四、Harness Engineering研发流程workflow

目标：掌握接力式的 Agent研发的完整流程，理解人工卡点和回退规则的设计逻辑

• 三段式结构：串联需求分析→方案设计→就绪评审，开发→审查→测试→交付，确认及归档

• 流程 Profile：同一套 workflow，三种流水线变体

• 8 个阶段详解：前置动作、输入、产出、流转条件

• 设计人工卡点：自动检查后在关键节点必须暂停，人工确认

• 五条流程铁律：下游不改上游制品 / PM 仅做调度 / 证据可查 / 边界不跨越 / 主控 Agent不越界

• 失败与回退策略：各阶段的异常场景与回退规则，以及人工处理策略

• 项目实例：基于完整项目代码的演示和实操

分组研讨 — 为你的项目设计 Agent研发流程workflow

• 你的项目Agent研发流程workflow如何设计

• 如何有效设置卡点，成本和风险如何平衡

五、Harness Engineering 多Agent 角色设计

目标：理解每个Agent角色的契约结构、输入输出、制衡关系

• 构建七个专业 Agent研发角色

• 各个 Agent 角色的整体设计

• 各个 Agent 角色的契约结构：身份 → 职责 → 输入 → 输出 → 阻塞条件 → 禁止事项 → 模型选择

• 各个 Agent 角色的实现细节

• 各个Agent 角色的制衡矩阵

• 常见反模式与避坑经验

• 项目实例：基于完整项目代码的演示和实操

分组研讨 — 角色制衡 vs 执行效率

• 哪些 Agent角色分离是必要的

• 简单项目哪些角色可以合并，降低复杂度

• 找出“绝对不能省”的三个Agent角色

六、Harness Engineering需求描述与 Specs 管理

目标：掌握Spec 作为 Source of Truth 的运作机制

• 两种常见的 Spec 编写范式区别及选择策略

• 需求条目格式：需求的描述方式，Scenario的 Given-When-Then 验收格式

• 每条需求至少 2 个 Scenario（1 正向 + 1 异常/边界）

• Spec Delta 的变更管理闭环

• 项目实例：基于完整项目代码的演示和实操

分组研讨 — 需求 vs 实现的边界

• 哪些该写在spec.md，哪些只能在 design.md

• 给你的项目编写 Spec 格式的需求

七、Harness Engineering模板体系

目标：了解 Proposal 和 6 个阶段文档模板的设计意图

• 需求澄清阶段Proposal 模板 9 个章节速览，重点的 8 项 checkbox

• 全部7 个阶段文档模板及关键章节：design.md、code-review.md、test-report等

• 核心价值：让 Agent 不需要想“该写什么”，只需要“填什么”——减少遗漏，提高一致性

• 项目实例：基于完整项目代码的演示和实操

八、Harness Engineering质量管控体系

目标：理解全流程质量卡点，能判断自己项目该在哪些环节设门禁

• 质量管控泳道图：需求澄清 → Spec →RR →人工审批 → Dev → CR → TE → 交付

• 需求质量：Proposal 定稿检查清单、BA 需求纯净度检查、RR 就绪评审

• 代码质量：TDD + verify.sh A/B/C 三类检查 + verify-after-developer Hook + baseline 对比

• 审查质量：需求及场景覆盖矩阵 + 就绪约束+ 偏离检测 + 可复用经验沉淀

• 测试质量：API 测试 + E2E 真实浏览器测试 + 回归测试 + 工程验证

• 交付质量：交付完整性验证 + 框架完整性检查 + Spec Merge 闭环

• 项目实例：基于完整项目代码的演示和实操

分组研讨 —质量卡点的设计

• 为你的项目设计全部质量卡点

• 从全部检查机制中选出最重要的三个卡点

九、Harness Engineering基础设施：知识图谱 + 任务跟踪 + MCP

目标：了解支撑流程运转的基础设施模块

• 代码库知识图谱：索引及整体结构

• 上下文管理：精确控制每个阶段可见的文件

• 任务跟踪与进展可见性：board.md 看板 + 开发日志

• MCP Server：暴露 8 个工具，MCP 不可用时

十、Harness Engineering 工程记忆与持续改进

目标：掌握记忆系统的完整生命周期

• 避免Agent 每次会话归零，同样的问题反复踩坑

• 记忆管理五阶段生命周期

• 记忆管理五段式模板：Symptom / Root Cause / Fix / Guardrail（核心）/ Detection

• 让经验变成防线的围栏建设：单元测试 / verify.sh 检查项 / Skills 更新 / 契约文档

• 项目实例：基于完整项目代码的演示和实操

分组研讨 — 你的项目如何管理记忆

• 回想你项目中一个“踩了两次以上”的坑

• 按五段式模板记录一条完整的 memory 条目

• 记忆管理如何嵌入到你的项目中

十一、Harness Engineering全流程演示

以示例项目开发需求为例，现场完整走一遍 Harness Engineering流程

• 现场执行初始化，目录创建 + 模板复制 + 看板登记 + 基线快照

• 与 Agent结对澄清新需求，明确“为什么做”/“做什么”/“不做什么”

• PM Agent 根据项目复杂度执行特定 workflow

• 启动 BA Agent → requirements.md（SHALL + GWT）

• 启动 SA Agent → design.md（需求→技术落实对照 + 架构/模块/接口/数据设计 + Tasks拆分）

• 启动 RR Agent → readiness-review.md（就绪检查，需求纯净度 + 覆盖度 → PASS / BLOCK）

• 现场审阅三份文档的结论，触发编码执行

• 启动Dev Agent → TDD 实现 + dev-log.md → verify.sh 硬校验

• 启动 CR Agent → code-review.md（R/S 逐条核对 git diff）

• 启动TE Agent → test-report.md（A/B/C/D 四类测试，B 类为真实浏览器 E2E 测试）

• PM Agent验收 → verify + baseline compare + check-harness → board 状态更新

• 人工确认完成情况，PM Agent 执行Spec Merge归档 → 标记 DONE → check-harness 终检

分组研讨 — 如何整体落地到你的项目

• 明天开始用 Harness，最先引入哪一层？

十、Harness Engineering 工程记忆与持续改进

目标：掌握记忆系统的完整生命周期

• 避免Agent 每次会话归零，同样的问题反复踩坑

• 记忆管理五阶段生命周期

• 记忆管理五段式模板：Symptom / Root Cause / Fix / Guardrail（核心）/ Detection

• 让经验变成防线的围栏建设：单元测试 / verify.sh 检查项 / Skills 更新 / 契约文档

• 项目实例：基于完整项目代码的演示和实操

分组研讨 — 你的项目如何管理记忆

• 回想你项目中一个“踩了两次以上”的坑

• 按五段式模板记录一条完整的 memory 条目

• 记忆管理如何嵌入到你的项目中

十一、Harness Engineering全流程演示

以示例项目开发需求为例，现场完整走一遍 Harness Engineering流程

• 现场执行初始化，目录创建 + 模板复制 + 看板登记 + 基线快照

• 与 Agent结对澄清新需求，明确“为什么做”/“做什么”/“不做什么”

• PM Agent 根据项目复杂度执行特定 workflow

• 启动 BA Agent → requirements.md（SHALL + GWT）

• 启动 SA Agent → design.md（需求→技术落实对照 + 架构/模块/接口/数据设计 + Tasks拆分）

• 启动 RR Agent → readiness-review.md（就绪检查，需求纯净度 + 覆盖度 → PASS / BLOCK）

• 现场审阅三份文档的结论，触发编码执行

• 启动Dev Agent → TDD 实现 + dev-log.md → verify.sh 硬校验

• 启动 CR Agent → code-review.md（R/S 逐条核对 git diff）

• 启动TE Agent → test-report.md（A/B/C/D 四类测试，B 类为真实浏览器 E2E 测试）

• PM Agent验收 → verify + baseline compare + check-harness → board 状态更新

• 人工确认完成情况，PM Agent 执行Spec Merge归档 → 标记 DONE → check-harness 终检

分组研讨 — 如何整体落地到你的项目

• 明天开始用 Harness，最先引入哪一层？

返回上一级

课程时长

2天

课程排期

待定

我要报名我要分享

课程推荐

返回上一级