课程背景
深入理解AI Agent的设计原理、核心组件和架构模式,掌握基于DeepSeek模型,结合工具使用、记忆机制和RAG等技术,在智算平台环境下进行AI Agent的构建、调试与部署。
课程对象
南京电信开发团队成员,对构建智能化、自主化应用或自动化工作流感兴趣,并具备一定编程基础。
课程要求
需配有自有智算大模型实验环境,能够稳定提供DeepSeek模型API访问,并提供向量数据库、Agent开发框架库(如Python环境、常用AI库)等支持。
课程大纲
第一天:Agent基础、DeepSeek作为大脑与工具调用精通
l 模块一:AI Agent核心概念与架构深潜
Ø AI Agent的定义与发展历程:从早期专家系统到大模型驱动的智能体。
Ø Agent的核心架构:感知、规划、行动、记忆。深入解析各模块在LLM Agent中的体现。
Ø Agent的类型:单Agent、协作Agent、分层Agent。
Ø Agent框架概览(概念性介绍,如LangChain, LlamaIndex):理解其为Agent开发提供的便利,但不深入特定框架代码细节。
Ø 实战:构建Agent的基本执行循环(无工具、无记忆)
环境准备: 熟悉平台上的开发环境(如Python环境)。
动手实践: 使用DeepSeek API,实现一个简单的Agent执行循环:接收用户输入 -> 调用DeepSeek生成响应。理解Agent的最小构成。
l 模块二:DeepSeek Function Calling与工具设计
Ø DeepSeek作为Agent的“大脑”: 分析其推理能力、指令遵循能力、以及Function Calling(函数调用)机制对Agent构建的重要性。
Ø Function Calling机制深度讲解: 详细介绍如何定义工具的Schema(OpenAPI Spec, JSON Schema等),如何将工具Schema提供给DeepSeek,以及如何解析DeepSeek生成的工具调用指令。
Ø 工具(Tool)的设计原则与实现:
工具的粒度:何时设计一个细粒度工具,何时设计一个粗粒度工具。
工具的鲁棒性:如何处理工具执行失败、异常输出。
工具的安全性与权限控制。
l 实现不同类型的工具:调用外部API、执行数据库查询、执行代码脚本、搜索互联网(模拟)。
l 实战:基于DeepSeek Function Calling构建并调用复杂工具
动手实践: 设计并实现一个调用外部API(模拟金融数据查询、内部系统状态检查等)或执行数据库查询的复杂工具。配置给DeepSeek,并进行多次调用和结果解析的实战。
模块三:Agent的行动与规划(ReAct模式深潜)
Ø Agent的行动空间与执行器。
Ø ReAct(Reasoning and Acting)模式深度解析: 理解其Thought-Action-Observation循环如何让Agent进行链式思考和工具调用以解决问题。
Ø 构建基于ReAct模式的Agent:Prompt设计、状态管理、循环控制。
Ø ReAct模式的优缺点与适用场景。
Ø 其他规划模式简介(如Chain-of-Thought with Tool Use)。
Ø 实战:实现一个基于ReAct模式的Agent
动手实践: 结合之前实现的工具和DeepSeek,构建一个遵循ReAct模式的Agent。设计一个需要多步思考和工具调用才能解决的问题,并调试Agent的执行流程。
第二天:Agent的记忆与高级Agent架构
l 模块四:Agent的记忆系统深度构建
Ø Agent记忆的必要性:维持对话上下文、学习长期知识、避免重复劳动。
Ø 短期记忆: Context Window管理策略(滑动窗口、摘要)、Prompt中的记忆表示。
Ø 长期记忆类型与实现:
对话历史记忆:结构化存储与摘要。
经验记忆:存储Agent的成功和失败经验。
语义记忆: 利用向量数据库存储和检索Agent获得的知识或思考过程。
Ø 记忆的检索与更新策略。
Ø 实战:构建Agent的长期记忆模块
环境准备: 熟悉平台上的向量数据库。
动手实践: 设计Agent的长期记忆结构(例如,存储重要的观察结果或思考步骤)。实现将信息Embedding后存入Vector DB,并在需要时检索相关记忆。
l 模块五:向量数据库与RAG在Agent记忆与知识增强中的应用
Ø RAG在Agent中的核心作用: 为Agent提供最新的、领域特定的或私有的知识,显著提升Agent的知识能力和准确性。
Ø 为Agent构建RAG知识源:将Agent需要访问的文档、代码、数据等转化为可检索的格式。
Ø RAG检索结果如何融入Agent的思维链或工具调用中。
Ø 结合Agent工作流的RAG高级策略: 例如,在规划阶段检索相关背景知识,在执行工具前检索工具使用文档。
Ø 实战:为Agent集成RAG能力
动手实践: 将之前构建的向量数据库和RAG组件与Agent结合。让Agent能够通过检索外部知识来完成任务或回答问题,例如,回答一个关于内部系统架构的问题,或根据产品手册完成一个配置任务。
l 模块六:多Agent系统与协作模式
Ø 为何需要多Agent系统:解决复杂任务、分工协作、模拟团队工作。
Ø 多Agent系统的架构模式:中心协调者模式、去中心化模式、层次化模式。
Ø Agent间的通信与协作机制:消息传递、共享内存、黑板系统。
Ø DeepSeek在多Agent系统中的应用:作为不同Agent的大脑,或作为协调Agent。
Ø 实战:设计一个简单的多Agent协作场景(概念设计或原型)
动手实践: 设计一个需要两个Agent协作完成的任务(例如,“需求分析Agent”与“代码生成Agent”协作)。讨论Agent间的职责划分和信息传递方式,并可能实现一个简单的原型来模拟其协作过程。
第三天:Agent开发高级话题与项目实践
l 模块七:Agent测试、调试与评估
Ø 测试Agent的挑战:非确定性、多步骤执行、与环境交互。
Ø Agent的测试策略:单元测试(工具、记忆)、集成测试(组件协作)、端到端测试。
Ø Agent的调试方法:日志记录、可视化执行路径、逐步跟踪。
Ø Agent性能评估指标:任务完成率、准确率、效率、鲁棒性。
Ø 实战:Agent测试与调试实践
动手实践: 为之前构建的Agent编写测试用例,学习如何调试Agent的执行流程和工具调用问题。
模块八:Agent部署、运维与持续优化
Ø Agent的部署架构考虑:同步调用 vs 异步调用、可伸缩性、高可用性。
Ø 在智算平台上部署Agent服务:容器化、服务管理。
Ø Agent的监控与日志分析。
Ø 用户反馈收集与Agent的持续学习/优化。
Ø 版本管理与回滚策略。
Ø 实战:Agent部署与监控初步(概念演示或平台功能实践)
动手实践: 在平台上进行Agent服务的初步部署。学习如何查看Agent的运行日志和监控指标。
l 模块九:Agent安全、治理与主题项目实战
Ø AI安全在Agent中的深度考量:
Agent的权限控制与访问管理:限制Agent可执行的操作范围。
防止恶意Prompt注入攻击Agent。
Agent行为约束与安全护栏(Guardrails)设计。
敏感信息处理与数据隐私保护。
Agent的可解释性与问责制。
Ø Agent在企业内部的治理框架:审批流程、使用规范、风险评估。
Ø 大模型项目实战:深入构建客服机器人Agent或深度调研系统Agent
动手实践: 学员分组或个人选择一个主题(客服机器人或深度调研),在前两天学习的基础上,深入构建一个更完整、更健壮的Agent。重点关注:
复杂对话流程管理(客服)。
多源信息整合与推理(调研)。
错误处理与用户友好性。
结合RAG提供精准信息。
集成多个工具。
Ø Agent技术的未来发展与在金融科技领域的创新应用展望。
Ø 总结与答疑。