基于DeepSeek的LLM Agent开发：原理、架构与实战

研发学院基于DeepSeek的LLM Agent开发：原理、架构与实战

Tyler

Ø 阿里任职期间，先后负责阿里云多部门算法工作，操盘过多项国家级产业项目算法工作。曾在多家世界500强企业承担人工智能技术负责人工作，具备深厚的数据智能系统研究和架构经验，实战经验覆盖包括C端B端的用户和商业化产品；

Ø 负责团队内部的技术招聘和面试工作，累计面试千人。作为阿里云的内部“布道师”参与多场内部培训。

Ø 全国信息学联赛一等奖保送并毕业于哈尔滨工业大学（C9），已发表多篇国际顶会和期刊发表学术论文；申请并已公开的国家发明专利 18 项，国际专利1项；

Ø 中国计算机学会技术前线委员会数据科学特邀讲者；

Ø 中国计算机学会（CCF）技术前线委员会（TF）委员，人工智能与模式识别会员会委员；

Ø 中国信通院标准化技术专家编委，作为主要作者参与“生成式人工智能”以及“人工智能应用安全”相关行业标准制定，致力于持续提高所负责团队以及行业的工程伦理素养。

查看老师详情

课程内容

课程背景

深入理解AI Agent的设计原理、核心组件和架构模式，掌握基于DeepSeek模型，结合工具使用、记忆机制和RAG等技术，在智算平台环境下进行AI Agent的构建、调试与部署。

课程对象

南京电信开发团队成员，对构建智能化、自主化应用或自动化工作流感兴趣，并具备一定编程基础。

课程要求

需配有自有智算大模型实验环境，能够稳定提供DeepSeek模型API访问，并提供向量数据库、Agent开发框架库（如Python环境、常用AI库）等支持。

课程大纲

第一天：Agent基础、DeepSeek作为大脑与工具调用精通

l 模块一：AI Agent核心概念与架构深潜

Ø AI Agent的定义与发展历程：从早期专家系统到大模型驱动的智能体。

Ø Agent的核心架构：感知、规划、行动、记忆。深入解析各模块在LLM Agent中的体现。

Ø Agent的类型：单Agent、协作Agent、分层Agent。

Ø Agent框架概览（概念性介绍，如LangChain, LlamaIndex）：理解其为Agent开发提供的便利，但不深入特定框架代码细节。

Ø 实战：构建Agent的基本执行循环（无工具、无记忆）

环境准备：熟悉平台上的开发环境（如Python环境）。

动手实践：使用DeepSeek API，实现一个简单的Agent执行循环：接收用户输入 -> 调用DeepSeek生成响应。理解Agent的最小构成。

l 模块二：DeepSeek Function Calling与工具设计

Ø DeepSeek作为Agent的“大脑”：分析其推理能力、指令遵循能力、以及Function Calling（函数调用）机制对Agent构建的重要性。

Ø Function Calling机制深度讲解：详细介绍如何定义工具的Schema（OpenAPI Spec, JSON Schema等），如何将工具Schema提供给DeepSeek，以及如何解析DeepSeek生成的工具调用指令。

Ø 工具（Tool）的设计原则与实现：

工具的粒度：何时设计一个细粒度工具，何时设计一个粗粒度工具。

工具的鲁棒性：如何处理工具执行失败、异常输出。

工具的安全性与权限控制。

l 实现不同类型的工具：调用外部API、执行数据库查询、执行代码脚本、搜索互联网（模拟）。

l 实战：基于DeepSeek Function Calling构建并调用复杂工具

动手实践：设计并实现一个调用外部API（模拟金融数据查询、内部系统状态检查等）或执行数据库查询的复杂工具。配置给DeepSeek，并进行多次调用和结果解析的实战。

模块三：Agent的行动与规划（ReAct模式深潜）

Ø Agent的行动空间与执行器。

Ø ReAct（Reasoning and Acting）模式深度解析：理解其Thought-Action-Observation循环如何让Agent进行链式思考和工具调用以解决问题。

Ø 构建基于ReAct模式的Agent：Prompt设计、状态管理、循环控制。

Ø ReAct模式的优缺点与适用场景。

Ø 其他规划模式简介（如Chain-of-Thought with Tool Use）。

Ø 实战：实现一个基于ReAct模式的Agent

动手实践：结合之前实现的工具和DeepSeek，构建一个遵循ReAct模式的Agent。设计一个需要多步思考和工具调用才能解决的问题，并调试Agent的执行流程。

第二天：Agent的记忆与高级Agent架构

l 模块四：Agent的记忆系统深度构建

Ø Agent记忆的必要性：维持对话上下文、学习长期知识、避免重复劳动。

Ø 短期记忆： Context Window管理策略（滑动窗口、摘要）、Prompt中的记忆表示。

Ø 长期记忆类型与实现：

对话历史记忆：结构化存储与摘要。

经验记忆：存储Agent的成功和失败经验。

语义记忆：利用向量数据库存储和检索Agent获得的知识或思考过程。

Ø 记忆的检索与更新策略。

Ø 实战：构建Agent的长期记忆模块

环境准备：熟悉平台上的向量数据库。

动手实践：设计Agent的长期记忆结构（例如，存储重要的观察结果或思考步骤）。实现将信息Embedding后存入Vector DB，并在需要时检索相关记忆。

l 模块五：向量数据库与RAG在Agent记忆与知识增强中的应用

Ø RAG在Agent中的核心作用：为Agent提供最新的、领域特定的或私有的知识，显著提升Agent的知识能力和准确性。

Ø 为Agent构建RAG知识源：将Agent需要访问的文档、代码、数据等转化为可检索的格式。

Ø RAG检索结果如何融入Agent的思维链或工具调用中。

Ø 结合Agent工作流的RAG高级策略：例如，在规划阶段检索相关背景知识，在执行工具前检索工具使用文档。

Ø 实战：为Agent集成RAG能力

动手实践：将之前构建的向量数据库和RAG组件与Agent结合。让Agent能够通过检索外部知识来完成任务或回答问题，例如，回答一个关于内部系统架构的问题，或根据产品手册完成一个配置任务。

l 模块六：多Agent系统与协作模式

Ø 为何需要多Agent系统：解决复杂任务、分工协作、模拟团队工作。

Ø 多Agent系统的架构模式：中心协调者模式、去中心化模式、层次化模式。

Ø Agent间的通信与协作机制：消息传递、共享内存、黑板系统。

Ø DeepSeek在多Agent系统中的应用：作为不同Agent的大脑，或作为协调Agent。

Ø 实战：设计一个简单的多Agent协作场景（概念设计或原型）

动手实践：设计一个需要两个Agent协作完成的任务（例如，“需求分析Agent”与“代码生成Agent”协作）。讨论Agent间的职责划分和信息传递方式，并可能实现一个简单的原型来模拟其协作过程。

第三天：Agent开发高级话题与项目实践

l 模块七：Agent测试、调试与评估

Ø 测试Agent的挑战：非确定性、多步骤执行、与环境交互。

Ø Agent的测试策略：单元测试（工具、记忆）、集成测试（组件协作）、端到端测试。

Ø Agent的调试方法：日志记录、可视化执行路径、逐步跟踪。

Ø Agent性能评估指标：任务完成率、准确率、效率、鲁棒性。

Ø 实战：Agent测试与调试实践

动手实践：为之前构建的Agent编写测试用例，学习如何调试Agent的执行流程和工具调用问题。

模块八：Agent部署、运维与持续优化

Ø Agent的部署架构考虑：同步调用 vs 异步调用、可伸缩性、高可用性。

Ø 在智算平台上部署Agent服务：容器化、服务管理。

Ø Agent的监控与日志分析。

Ø 用户反馈收集与Agent的持续学习/优化。

Ø 版本管理与回滚策略。

Ø 实战：Agent部署与监控初步（概念演示或平台功能实践）

动手实践：在平台上进行Agent服务的初步部署。学习如何查看Agent的运行日志和监控指标。

l 模块九：Agent安全、治理与主题项目实战

Ø AI安全在Agent中的深度考量：

Agent的权限控制与访问管理：限制Agent可执行的操作范围。

防止恶意Prompt注入攻击Agent。

Agent行为约束与安全护栏（Guardrails）设计。

敏感信息处理与数据隐私保护。

Agent的可解释性与问责制。

Ø Agent在企业内部的治理框架：审批流程、使用规范、风险评估。

Ø 大模型项目实战：深入构建客服机器人Agent或深度调研系统Agent

动手实践：学员分组或个人选择一个主题（客服机器人或深度调研），在前两天学习的基础上，深入构建一个更完整、更健壮的Agent。重点关注：

复杂对话流程管理（客服）。

多源信息整合与推理（调研）。

错误处理与用户友好性。

结合RAG提供精准信息。

集成多个工具。

Ø Agent技术的未来发展与在金融科技领域的创新应用展望。

Ø 总结与答疑。

返回上一级

课程时长

3天

课程排期

待定

我要报名我要分享

课程推荐

返回上一级