4006-998-758
3000+课程任你选择
HARNESS ENGINEERING
研发学院 HARNESS ENGINEERING
张乐

曾任职惠普、埃森哲等全球TOP外企,国内一线互联网公司

曾任百度云、百度金融事业部 敏捷与DevOps转型的主导者

超过十五年敏捷转型、工程效能提升和大型项目管理实践经验,积累了丰厚的知识体系和众多一线案例

曾主导数百人团队实施DevOps转型,在保证质量的前提下发布频率提高数倍

在业界积极推动DevOps方法和技术,发布『DevOps道法术器』体系化实施框架

设计并实现端到端持续交付流水线工具落地解决方案


查看老师详情
课程内容

课程亮点

• 业内首个基于完整工程项目的HARNESS ENGINEERING 实践课程,全程聚焦真实落地实操

• 从一手经验切入: 以 AI Agent 典型问题开篇,建立核心认知:能力上限看模型,交付下限看工程

• 全景多要素拆解: Rules、Skills、Sub-agents、Hooks、MCPs、Memory,逐个模块讲解实现

结构、设计模式与反模式、常见陷阱,不止"是什么",更讲"怎么用好"

• 覆盖前沿方向:提示词工程->上下文工程->知识工程->驾驭工程逐层递进,从氛围编程的问题出

发,结合规约编程框架,给出从"能跑"到"可控"的完整路径

• 四层递进防线架构:全局规范 → 研发 SOP → 多 Agent 制衡 → 脚本硬检查,控制逐层收紧

• 完整研发 Workflow 设计:串联需求到交付全流程(兼顾不同级别需求),五条铁律 + 人工卡点

+ 回退策略,兼顾效率与风险

• 全流程质量门禁:就绪检查+ 人工确认+ TDD + 脚本检查 + 需求覆盖矩阵 + E2E 测试

• 记忆系统解决"反复踩坑": 五阶段生命周期 + 五段式模板,让经验变成后续的防线

• 全流程实操 + 分组研讨:现场完整走完多Agent 接力协作,帮助学员建立自己项目的落地计划

课程大纲

一、为什么需要 Harness Engineering

目标:理解 AI Agent 增强软件研发的结构性问题,建立流程治理的必要性认知

• AI Agent 在实际研发中的四类典型失败:规则遗忘、约束规避、虚报完成、跨会话失忆

• 核心命题:Agent 的能力上限取决于模型,交付质量的下限取决于流程和工程能力

分组研讨 — 你踩过的 AI 编程坑

• 总结 AI Agent 研发过程中效果不佳的案例

• 判断属于哪类失败,为什么效果不佳,潜在的解决思路

二、Harness Engineering 基础技术要素

目标:掌握 AI Agent 企业级建设的基础要素,理解 Harness 如何组合这些要素构建管控框架

Rules — 规则规范

• 实现结构与编写规范,应用时的常见陷阱

• 运作机制与激活方式,Token 预算管理(如何确保模型能够遵循 Rules)

• 优先级与作用域,局限性(Rules 是自然语言指令,不是程序化约束)

Skills — SOP 封装

• 与 Rules 的关键区别,什么适合做成 Skills(指令序列与标准操作)

• 实现结构与三层资源分工

• 设计模式与反模式,好的 Skills / 差的 Skills 特征

• Skills如何评估及优化

Sub-agents — 角色隔离

• 构建方式与调用流程,上下文隔离的意义

• 五种典型场景,以及五种落地实施方式

• 五大主流编排模式,Harness 选择哪种模式

• 契约的设计与上下文管理,工程实践原则

Hooks — 事件驱动自动化

• 主流事件与典型用途

• 通信协议与响应控制

• Harness 中 Hooks的设计

MCPs — 工具接口标准化

• 协议架构与三层模型

• 用法与配置,何时使用 MCP / Bash

• 定位与降级策略

Memory — 记忆管理

• 显式记忆与自动记忆

• 记忆的实时提取与定期整理

上下文工程

• 提示词工程(案例:Claude Code 七层提示词结构设计)

• 上下文工程(案例:仓库索引、整仓深度理解、上下文压缩)

• 知识工程(案例:如何构建企业内部的知识工程平台)

• 综合案例(百万行遗留项目如何提升AI 编码效果和质量)

规约编程

• 氛围编程的问题与企业应用方式

• 从氛围编程走向可行代码的四个关键实践

• 如何确保代码质量及规范合规

• GitHub Spec Kit 的五阶段工作流及实践案例

• GitHub Spec Kit 的应用落地(案例:模板优化与功能增强)

• OpenSpec轻量级规约驱动开发框架的核心工件与工作流

• OpenSpec两种工作模式,适配不同研发场景

• OpenSpec应用落地(案例:定制开发,扩展为多Agent工作流)

三、Harness Engineering实现架构:四层递进防线

目标:掌握Harness Engineering四层体系的职责分工与递进关系

• 第一层:建设全局底线、编码规范、流程纪律

• 第二层:建设研发标准操作规程专项 SOP

• 第三层:多 Agent角色构建与制衡机制

• 第四层:建设严格的逻辑检查,替代 Agent 自述

• 项目实例:基于完整项目代码的演示和实操

分组研讨 — 为你的项目设计Harness管控防线

• 针对第一次讨论的 Agent 编程问题,如何设计你的管控防线

• 列举可通过 Rules、Skills、Subagent、Scripts 处理的实际问题

四、Harness Engineering研发流程workflow

目标:掌握接力式的 Agent研发的完整流程,理解人工卡点和回退规则的设计逻辑

• 三段式结构:串联 需求分析→方案设计→就绪评审,开发→审查→测试→交付,确认及归档

• 流程 Profile:同一套 workflow,三种流水线变体

• 8 个阶段详解:前置动作、输入、产出、流转条件

• 设计人工卡点:自动检查后在关键节点必须暂停,人工确认

• 五条流程铁律:下游不改上游制品 / PM 仅做调度 / 证据可查 / 边界不跨越 / 主控 Agent不越界

• 失败与回退策略:各阶段的异常场景与回退规则,以及人工处理策略

• 项目实例:基于完整项目代码的演示和实操

分组研讨 — 为你的项目设计 Agent研发流程workflow

• 你的项目Agent研发流程workflow如何设计

• 如何有效设置卡点,成本和风险如何平衡

五、Harness Engineering 多Agent 角色设计

目标:理解每个Agent角色的契约结构、输入输出、制衡关系

• 构建七个专业 Agent研发角色

• 各个 Agent 角色的整体设计

• 各个 Agent 角色的契约结构:身份 → 职责 → 输入 → 输出 → 阻塞条件 → 禁止事项 → 模型选择

• 各个 Agent 角色的实现细节

• 各个Agent 角色的制衡矩阵

• 常见反模式与避坑经验

• 项目实例:基于完整项目代码的演示和实操

分组研讨 — 角色制衡 vs 执行效率

• 哪些 Agent角色分离是必要的

• 简单项目哪些角色可以合并,降低复杂度

• 找出“绝对不能省”的三个Agent角色

六、Harness Engineering需求描述与 Specs 管理

目标:掌握Spec 作为 Source of Truth 的运作机制

• 两种常见的 Spec 编写范式区别及选择策略

• 需求条目格式:需求的描述方式,Scenario的 Given-When-Then 验收格式

• 每条需求至少 2 个 Scenario(1 正向 + 1 异常/边界)

• Spec Delta 的变更管理闭环

• 项目实例:基于完整项目代码的演示和实操

分组研讨 — 需求 vs 实现的边界

• 哪些该写在spec.md,哪些只能在 design.md

• 给你的项目编写 Spec 格式的需求

七、Harness Engineering模板体系

目标:了解 Proposal 和 6 个阶段文档模板的设计意图

• 需求澄清阶段Proposal 模板 9 个章节速览,重点的 8 项 checkbox

• 全部7 个阶段文档模板及关键章节:design.md、code-review.md、test-report等

• 核心价值:让 Agent 不需要想“该写什么”,只需要“填什么”——减少遗漏,提高一致性

• 项目实例:基于完整项目代码的演示和实操

八、Harness Engineering质量管控体系

目标:理解全流程质量卡点,能判断自己项目该在哪些环节设门禁

• 质量管控泳道图:需求澄清 → Spec →RR →人工审批 → Dev → CR → TE → 交付

• 需求质量:Proposal 定稿检查清单、BA 需求纯净度检查、RR 就绪评审

• 代码质量:TDD + verify.sh A/B/C 三类检查 + verify-after-developer Hook + baseline 对比

• 审查质量:需求及场景覆盖矩阵 + 就绪约束+ 偏离检测 + 可复用经验沉淀

• 测试质量:API 测试 + E2E 真实浏览器测试 + 回归测试 + 工程验证

• 交付质量:交付完整性验证 + 框架完整性检查 + Spec Merge 闭环

• 项目实例:基于完整项目代码的演示和实操

分组研讨 —质量卡点的设计

• 为你的项目设计全部质量卡点

• 从全部检查机制中选出最重要的三个卡点

九、Harness Engineering基础设施:知识图谱 + 任务跟踪 + MCP

目标:了解支撑流程运转的基础设施模块

• 代码库知识图谱:索引及整体结构

• 上下文管理:精确控制每个阶段可见的文件

• 任务跟踪与进展可见性:board.md 看板 + 开发日志

• MCP Server:暴露 8 个工具,MCP 不可用时

十、Harness Engineering 工程记忆与持续改进

目标:掌握记忆系统的完整生命周期

• 避免Agent 每次会话归零,同样的问题反复踩坑

• 记忆管理五阶段生命周期

• 记忆管理五段式模板:Symptom / Root Cause / Fix / Guardrail(核心)/ Detection

• 让经验变成防线的围栏建设:单元测试 / verify.sh 检查项 / Skills 更新 / 契约文档

• 项目实例:基于完整项目代码的演示和实操

分组研讨 — 你的项目如何管理记忆

• 回想你项目中一个“踩了两次以上”的坑

• 按五段式模板记录一条完整的 memory 条目

• 记忆管理如何嵌入到你的项目中

十一、Harness Engineering全流程演示

以示例项目开发需求为例,现场完整走一遍 Harness Engineering流程

• 现场执行初始化,目录创建 + 模板复制 + 看板登记 + 基线快照

• 与 Agent结对澄清新需求,明确“为什么做”/“做什么”/“不做什么”

• PM Agent 根据项目复杂度执行特定 workflow

• 启动 BA Agent → requirements.md(SHALL + GWT)

• 启动 SA Agent → design.md(需求→技术落实对照 + 架构/模块/接口/数据设计 + Tasks拆分)

• 启动 RR Agent → readiness-review.md(就绪检查,需求纯净度 + 覆盖度 → PASS / BLOCK)

• 现场审阅三份文档的结论,触发编码执行

• 启动Dev Agent → TDD 实现 + dev-log.md → verify.sh 硬校验

• 启动 CR Agent → code-review.md(R/S 逐条核对 git diff)

• 启动TE Agent → test-report.md(A/B/C/D 四类测试,B 类为真实浏览器 E2E 测试)

• PM Agent验收 → verify + baseline compare + check-harness → board 状态更新

• 人工确认完成情况,PM Agent 执行Spec Merge归档 → 标记 DONE → check-harness 终检

分组研讨 — 如何整体落地到你的项目

• 明天开始用 Harness,最先引入哪一层?

十、Harness Engineering 工程记忆与持续改进

目标:掌握记忆系统的完整生命周期

• 避免Agent 每次会话归零,同样的问题反复踩坑

• 记忆管理五阶段生命周期

• 记忆管理五段式模板:Symptom / Root Cause / Fix / Guardrail(核心)/ Detection

• 让经验变成防线的围栏建设:单元测试 / verify.sh 检查项 / Skills 更新 / 契约文档

• 项目实例:基于完整项目代码的演示和实操

分组研讨 — 你的项目如何管理记忆

• 回想你项目中一个“踩了两次以上”的坑

• 按五段式模板记录一条完整的 memory 条目

• 记忆管理如何嵌入到你的项目中

十一、Harness Engineering全流程演示

以示例项目开发需求为例,现场完整走一遍 Harness Engineering流程

• 现场执行初始化,目录创建 + 模板复制 + 看板登记 + 基线快照

• 与 Agent结对澄清新需求,明确“为什么做”/“做什么”/“不做什么”

• PM Agent 根据项目复杂度执行特定 workflow

• 启动 BA Agent → requirements.md(SHALL + GWT)

• 启动 SA Agent → design.md(需求→技术落实对照 + 架构/模块/接口/数据设计 + Tasks拆分)

• 启动 RR Agent → readiness-review.md(就绪检查,需求纯净度 + 覆盖度 → PASS / BLOCK)

• 现场审阅三份文档的结论,触发编码执行

• 启动Dev Agent → TDD 实现 + dev-log.md → verify.sh 硬校验

• 启动 CR Agent → code-review.md(R/S 逐条核对 git diff)

• 启动TE Agent → test-report.md(A/B/C/D 四类测试,B 类为真实浏览器 E2E 测试)

• PM Agent验收 → verify + baseline compare + check-harness → board 状态更新

• 人工确认完成情况,PM Agent 执行Spec Merge归档 → 标记 DONE → check-harness 终检

分组研讨 — 如何整体落地到你的项目

• 明天开始用 Harness,最先引入哪一层?


返回上一级