课程亮点
• 业内首个基于完整工程项目的HARNESS ENGINEERING 实践课程,全程聚焦真实落地实操
• 从一手经验切入: 以 AI Agent 典型问题开篇,建立核心认知:能力上限看模型,交付下限看工程
• 全景多要素拆解: Rules、Skills、Sub-agents、Hooks、MCPs、Memory,逐个模块讲解实现
结构、设计模式与反模式、常见陷阱,不止"是什么",更讲"怎么用好"
• 覆盖前沿方向:提示词工程->上下文工程->知识工程->驾驭工程逐层递进,从氛围编程的问题出
发,结合规约编程框架,给出从"能跑"到"可控"的完整路径
• 四层递进防线架构:全局规范 → 研发 SOP → 多 Agent 制衡 → 脚本硬检查,控制逐层收紧
• 完整研发 Workflow 设计:串联需求到交付全流程(兼顾不同级别需求),五条铁律 + 人工卡点
+ 回退策略,兼顾效率与风险
• 全流程质量门禁:就绪检查+ 人工确认+ TDD + 脚本检查 + 需求覆盖矩阵 + E2E 测试
• 记忆系统解决"反复踩坑": 五阶段生命周期 + 五段式模板,让经验变成后续的防线
• 全流程实操 + 分组研讨:现场完整走完多Agent 接力协作,帮助学员建立自己项目的落地计划
课程大纲
一、为什么需要 Harness Engineering
目标:理解 AI Agent 增强软件研发的结构性问题,建立流程治理的必要性认知
• AI Agent 在实际研发中的四类典型失败:规则遗忘、约束规避、虚报完成、跨会话失忆
• 核心命题:Agent 的能力上限取决于模型,交付质量的下限取决于流程和工程能力
分组研讨 — 你踩过的 AI 编程坑
• 总结 AI Agent 研发过程中效果不佳的案例
• 判断属于哪类失败,为什么效果不佳,潜在的解决思路
二、Harness Engineering 基础技术要素
目标:掌握 AI Agent 企业级建设的基础要素,理解 Harness 如何组合这些要素构建管控框架
Rules — 规则规范
• 实现结构与编写规范,应用时的常见陷阱
• 运作机制与激活方式,Token 预算管理(如何确保模型能够遵循 Rules)
• 优先级与作用域,局限性(Rules 是自然语言指令,不是程序化约束)
Skills — SOP 封装
• 与 Rules 的关键区别,什么适合做成 Skills(指令序列与标准操作)
• 实现结构与三层资源分工
• 设计模式与反模式,好的 Skills / 差的 Skills 特征
• Skills如何评估及优化
Sub-agents — 角色隔离
• 构建方式与调用流程,上下文隔离的意义
• 五种典型场景,以及五种落地实施方式
• 五大主流编排模式,Harness 选择哪种模式
• 契约的设计与上下文管理,工程实践原则
Hooks — 事件驱动自动化
• 主流事件与典型用途
• 通信协议与响应控制
• Harness 中 Hooks的设计
MCPs — 工具接口标准化
• 协议架构与三层模型
• 用法与配置,何时使用 MCP / Bash
• 定位与降级策略
Memory — 记忆管理
• 显式记忆与自动记忆
• 记忆的实时提取与定期整理
上下文工程
• 提示词工程(案例:Claude Code 七层提示词结构设计)
• 上下文工程(案例:仓库索引、整仓深度理解、上下文压缩)
• 知识工程(案例:如何构建企业内部的知识工程平台)
• 综合案例(百万行遗留项目如何提升AI 编码效果和质量)
规约编程
• 氛围编程的问题与企业应用方式
• 从氛围编程走向可行代码的四个关键实践
• 如何确保代码质量及规范合规
• GitHub Spec Kit 的五阶段工作流及实践案例
• GitHub Spec Kit 的应用落地(案例:模板优化与功能增强)
• OpenSpec轻量级规约驱动开发框架的核心工件与工作流
• OpenSpec两种工作模式,适配不同研发场景
• OpenSpec应用落地(案例:定制开发,扩展为多Agent工作流)
三、Harness Engineering实现架构:四层递进防线
目标:掌握Harness Engineering四层体系的职责分工与递进关系
• 第一层:建设全局底线、编码规范、流程纪律
• 第二层:建设研发标准操作规程专项 SOP
• 第三层:多 Agent角色构建与制衡机制
• 第四层:建设严格的逻辑检查,替代 Agent 自述
• 项目实例:基于完整项目代码的演示和实操
分组研讨 — 为你的项目设计Harness管控防线
• 针对第一次讨论的 Agent 编程问题,如何设计你的管控防线
• 列举可通过 Rules、Skills、Subagent、Scripts 处理的实际问题
四、Harness Engineering研发流程workflow
目标:掌握接力式的 Agent研发的完整流程,理解人工卡点和回退规则的设计逻辑
• 三段式结构:串联 需求分析→方案设计→就绪评审,开发→审查→测试→交付,确认及归档
• 流程 Profile:同一套 workflow,三种流水线变体
• 8 个阶段详解:前置动作、输入、产出、流转条件
• 设计人工卡点:自动检查后在关键节点必须暂停,人工确认
• 五条流程铁律:下游不改上游制品 / PM 仅做调度 / 证据可查 / 边界不跨越 / 主控 Agent不越界
• 失败与回退策略:各阶段的异常场景与回退规则,以及人工处理策略
• 项目实例:基于完整项目代码的演示和实操
分组研讨 — 为你的项目设计 Agent研发流程workflow
• 你的项目Agent研发流程workflow如何设计
• 如何有效设置卡点,成本和风险如何平衡
五、Harness Engineering 多Agent 角色设计
目标:理解每个Agent角色的契约结构、输入输出、制衡关系
• 构建七个专业 Agent研发角色
• 各个 Agent 角色的整体设计
• 各个 Agent 角色的契约结构:身份 → 职责 → 输入 → 输出 → 阻塞条件 → 禁止事项 → 模型选择
• 各个 Agent 角色的实现细节
• 各个Agent 角色的制衡矩阵
• 常见反模式与避坑经验
• 项目实例:基于完整项目代码的演示和实操
分组研讨 — 角色制衡 vs 执行效率
• 哪些 Agent角色分离是必要的
• 简单项目哪些角色可以合并,降低复杂度
• 找出“绝对不能省”的三个Agent角色
六、Harness Engineering需求描述与 Specs 管理
目标:掌握Spec 作为 Source of Truth 的运作机制
• 两种常见的 Spec 编写范式区别及选择策略
• 需求条目格式:需求的描述方式,Scenario的 Given-When-Then 验收格式
• 每条需求至少 2 个 Scenario(1 正向 + 1 异常/边界)
• Spec Delta 的变更管理闭环
• 项目实例:基于完整项目代码的演示和实操
分组研讨 — 需求 vs 实现的边界
• 哪些该写在spec.md,哪些只能在 design.md
• 给你的项目编写 Spec 格式的需求
七、Harness Engineering模板体系
目标:了解 Proposal 和 6 个阶段文档模板的设计意图
• 需求澄清阶段Proposal 模板 9 个章节速览,重点的 8 项 checkbox
• 全部7 个阶段文档模板及关键章节:design.md、code-review.md、test-report等
• 核心价值:让 Agent 不需要想“该写什么”,只需要“填什么”——减少遗漏,提高一致性
• 项目实例:基于完整项目代码的演示和实操
八、Harness Engineering质量管控体系
目标:理解全流程质量卡点,能判断自己项目该在哪些环节设门禁
• 质量管控泳道图:需求澄清 → Spec →RR →人工审批 → Dev → CR → TE → 交付
• 需求质量:Proposal 定稿检查清单、BA 需求纯净度检查、RR 就绪评审
• 代码质量:TDD + verify.sh A/B/C 三类检查 + verify-after-developer Hook + baseline 对比
• 审查质量:需求及场景覆盖矩阵 + 就绪约束+ 偏离检测 + 可复用经验沉淀
• 测试质量:API 测试 + E2E 真实浏览器测试 + 回归测试 + 工程验证
• 交付质量:交付完整性验证 + 框架完整性检查 + Spec Merge 闭环
• 项目实例:基于完整项目代码的演示和实操
分组研讨 —质量卡点的设计
• 为你的项目设计全部质量卡点
• 从全部检查机制中选出最重要的三个卡点
九、Harness Engineering基础设施:知识图谱 + 任务跟踪 + MCP
目标:了解支撑流程运转的基础设施模块
• 代码库知识图谱:索引及整体结构
• 上下文管理:精确控制每个阶段可见的文件
• 任务跟踪与进展可见性:board.md 看板 + 开发日志
• MCP Server:暴露 8 个工具,MCP 不可用时
十、Harness Engineering 工程记忆与持续改进
目标:掌握记忆系统的完整生命周期
• 避免Agent 每次会话归零,同样的问题反复踩坑
• 记忆管理五阶段生命周期
• 记忆管理五段式模板:Symptom / Root Cause / Fix / Guardrail(核心)/ Detection
• 让经验变成防线的围栏建设:单元测试 / verify.sh 检查项 / Skills 更新 / 契约文档
• 项目实例:基于完整项目代码的演示和实操
分组研讨 — 你的项目如何管理记忆
• 回想你项目中一个“踩了两次以上”的坑
• 按五段式模板记录一条完整的 memory 条目
• 记忆管理如何嵌入到你的项目中
十一、Harness Engineering全流程演示
以示例项目开发需求为例,现场完整走一遍 Harness Engineering流程
• 现场执行初始化,目录创建 + 模板复制 + 看板登记 + 基线快照
• 与 Agent结对澄清新需求,明确“为什么做”/“做什么”/“不做什么”
• PM Agent 根据项目复杂度执行特定 workflow
• 启动 BA Agent → requirements.md(SHALL + GWT)
• 启动 SA Agent → design.md(需求→技术落实对照 + 架构/模块/接口/数据设计 + Tasks拆分)
• 启动 RR Agent → readiness-review.md(就绪检查,需求纯净度 + 覆盖度 → PASS / BLOCK)
• 现场审阅三份文档的结论,触发编码执行
• 启动Dev Agent → TDD 实现 + dev-log.md → verify.sh 硬校验
• 启动 CR Agent → code-review.md(R/S 逐条核对 git diff)
• 启动TE Agent → test-report.md(A/B/C/D 四类测试,B 类为真实浏览器 E2E 测试)
• PM Agent验收 → verify + baseline compare + check-harness → board 状态更新
• 人工确认完成情况,PM Agent 执行Spec Merge归档 → 标记 DONE → check-harness 终检
分组研讨 — 如何整体落地到你的项目
• 明天开始用 Harness,最先引入哪一层?
十、Harness Engineering 工程记忆与持续改进
目标:掌握记忆系统的完整生命周期
• 避免Agent 每次会话归零,同样的问题反复踩坑
• 记忆管理五阶段生命周期
• 记忆管理五段式模板:Symptom / Root Cause / Fix / Guardrail(核心)/ Detection
• 让经验变成防线的围栏建设:单元测试 / verify.sh 检查项 / Skills 更新 / 契约文档
• 项目实例:基于完整项目代码的演示和实操
分组研讨 — 你的项目如何管理记忆
• 回想你项目中一个“踩了两次以上”的坑
• 按五段式模板记录一条完整的 memory 条目
• 记忆管理如何嵌入到你的项目中
十一、Harness Engineering全流程演示
以示例项目开发需求为例,现场完整走一遍 Harness Engineering流程
• 现场执行初始化,目录创建 + 模板复制 + 看板登记 + 基线快照
• 与 Agent结对澄清新需求,明确“为什么做”/“做什么”/“不做什么”
• PM Agent 根据项目复杂度执行特定 workflow
• 启动 BA Agent → requirements.md(SHALL + GWT)
• 启动 SA Agent → design.md(需求→技术落实对照 + 架构/模块/接口/数据设计 + Tasks拆分)
• 启动 RR Agent → readiness-review.md(就绪检查,需求纯净度 + 覆盖度 → PASS / BLOCK)
• 现场审阅三份文档的结论,触发编码执行
• 启动Dev Agent → TDD 实现 + dev-log.md → verify.sh 硬校验
• 启动 CR Agent → code-review.md(R/S 逐条核对 git diff)
• 启动TE Agent → test-report.md(A/B/C/D 四类测试,B 类为真实浏览器 E2E 测试)
• PM Agent验收 → verify + baseline compare + check-harness → board 状态更新
• 人工确认完成情况,PM Agent 执行Spec Merge归档 → 标记 DONE → check-harness 终检
分组研讨 — 如何整体落地到你的项目
• 明天开始用 Harness,最先引入哪一层?


