4006-998-758
3000+课程任你选择
基于DeepSeek的LLM Agent开发 :原理、架构与实战
研发学院 基于DeepSeek的LLM Agent开发 :原理、架构与实战
Tyler

Ø  阿里任职期间后负责阿里云多部门算法工作,操盘过多项国家级产业项目算法工作。曾在多家世界500强企业承担人工智能技术负责人工作,具备深厚的数据智能系统研究和架构经验,实战经验覆盖包括C端B端的用户和商业化产品;

Ø  负责团队内部的技术招聘和面试工作,累计面试千人。作为阿里云内部“布道师”参与多场内部培训

Ø  全国信息学联赛一等奖保送并毕业于哈尔滨工业大学(C9),已发表多篇国际顶会和期刊发表学术论文;申请并已公开的国家发明专利 18 项,国际专利1项;

Ø  中国计算机学会技术前线委员会数据科学特邀讲者;

Ø  中国计算机学会(CCF)技术前线委员会(TF)委员人工智能与模式识别会员会委员

Ø  中国信通院标准化技术专家编委,作为主要作者参与“生成式人工智能”以及“人工智能应用安全”相关行业标准制定,致力于持续提高所负责团队以及行业的工程伦理素养。

查看老师详情
课程内容

课程背景

基于DeepSeek的LLM Agent开发 :原理、架构与实战(图1)深入理解AI Agent的设计原理、核心组件和架构模式,掌握基于DeepSeek模型,结合工具使用、记忆机制和RAG等技术,在智算平台环境下进行AI Agent的构建、调试与部署。


课程对象

南京电信开发团队成员,对构建智能化、自主化应用或自动化工作流感兴趣,并具备一定编程基础。


课程要求

需配有自有智算大模型实验环境,能够稳定提供DeepSeek模型API访问,并提供向量数据库、Agent开发框架库(如Python环境、常用AI库)等支持。


课程大纲

第一天:Agent基础、DeepSeek作为大脑与工具调用精通

l  模块一:AI Agent核心概念与架构深潜

Ø  AI Agent的定义与发展历程:从早期专家系统到大模型驱动的智能体。

Ø  Agent的核心架构:感知、规划、行动、记忆。深入解析各模块在LLM Agent中的体现。

Ø  Agent的类型:单Agent、协作Agent、分层Agent。

Ø  Agent框架概览(概念性介绍,如LangChain, LlamaIndex):理解其为Agent开发提供的便利,但不深入特定框架代码细节。

Ø  实战:构建Agent的基本执行循环(无工具、无记忆)

基于DeepSeek的LLM Agent开发 :原理、架构与实战(图2)  环境准备: 熟悉平台上的开发环境(如Python环境)。

基于DeepSeek的LLM Agent开发 :原理、架构与实战(图2)  动手实践: 使用DeepSeek API,实现一个简单的Agent执行循环:接收用户输入 -> 调用DeepSeek生成响应。理解Agent的最小构成。

l  模块二:DeepSeek Function Calling与工具设计

Ø  DeepSeek作为Agent的“大脑”: 分析其推理能力、指令遵循能力、以及Function Calling(函数调用)机制对Agent构建的重要性。

Ø  Function Calling机制深度讲解: 详细介绍如何定义工具的Schema(OpenAPI Spec, JSON Schema等),如何将工具Schema提供给DeepSeek,以及如何解析DeepSeek生成的工具调用指令。

Ø  工具(Tool)的设计原则与实现:

基于DeepSeek的LLM Agent开发 :原理、架构与实战(图2)  工具的粒度:何时设计一个细粒度工具,何时设计一个粗粒度工具。

基于DeepSeek的LLM Agent开发 :原理、架构与实战(图2)  工具的鲁棒性:如何处理工具执行失败、异常输出。

基于DeepSeek的LLM Agent开发 :原理、架构与实战(图2)  工具的安全性与权限控制。

l  实现不同类型的工具:调用外部API、执行数据库查询、执行代码脚本、搜索互联网(模拟)。

l  实战:基于DeepSeek Function Calling构建并调用复杂工具

基于DeepSeek的LLM Agent开发 :原理、架构与实战(图2)  动手实践: 设计并实现一个调用外部API(模拟金融数据查询、内部系统状态检查等)或执行数据库查询的复杂工具。配置给DeepSeek,并进行多次调用和结果解析的实战。

模块三:Agent的行动与规划(ReAct模式深潜)

Ø  Agent的行动空间与执行器。

Ø  ReAct(Reasoning and Acting)模式深度解析: 理解其Thought-Action-Observation循环如何让Agent进行链式思考和工具调用以解决问题。

Ø  构建基于ReAct模式的Agent:Prompt设计、状态管理、循环控制。

Ø  ReAct模式的优缺点与适用场景。

Ø  其他规划模式简介(如Chain-of-Thought with Tool Use)。

Ø  实战:实现一个基于ReAct模式的Agent

基于DeepSeek的LLM Agent开发 :原理、架构与实战(图2)  动手实践: 结合之前实现的工具和DeepSeek,构建一个遵循ReAct模式的Agent。设计一个需要多步思考和工具调用才能解决的问题,并调试Agent的执行流程。

 

第二天:Agent的记忆与高级Agent架构

l  模块四:Agent的记忆系统深度构建

Ø  Agent记忆的必要性:维持对话上下文、学习长期知识、避免重复劳动。

Ø  短期记忆: Context Window管理策略(滑动窗口、摘要)、Prompt中的记忆表示。

Ø  长期记忆类型与实现:

基于DeepSeek的LLM Agent开发 :原理、架构与实战(图2)  对话历史记忆:结构化存储与摘要。

基于DeepSeek的LLM Agent开发 :原理、架构与实战(图2)  经验记忆:存储Agent的成功和失败经验。

基于DeepSeek的LLM Agent开发 :原理、架构与实战(图2)  语义记忆: 利用向量数据库存储和检索Agent获得的知识或思考过程。

Ø  记忆的检索与更新策略。

Ø  实战:构建Agent的长期记忆模块

基于DeepSeek的LLM Agent开发 :原理、架构与实战(图2)  环境准备: 熟悉平台上的向量数据库。

基于DeepSeek的LLM Agent开发 :原理、架构与实战(图2)  动手实践: 设计Agent的长期记忆结构(例如,存储重要的观察结果或思考步骤)。实现将信息Embedding后存入Vector DB,并在需要时检索相关记忆。

l  模块五:向量数据库与RAG在Agent记忆与知识增强中的应用

Ø  RAG在Agent中的核心作用: 为Agent提供最新的、领域特定的或私有的知识,显著提升Agent的知识能力和准确性。

Ø  为Agent构建RAG知识源:将Agent需要访问的文档、代码、数据等转化为可检索的格式。

Ø  RAG检索结果如何融入Agent的思维链或工具调用中。

Ø  结合Agent工作流的RAG高级策略: 例如,在规划阶段检索相关背景知识,在执行工具前检索工具使用文档。

Ø  实战:为Agent集成RAG能力

基于DeepSeek的LLM Agent开发 :原理、架构与实战(图2)  动手实践: 将之前构建的向量数据库和RAG组件与Agent结合。让Agent能够通过检索外部知识来完成任务或回答问题,例如,回答一个关于内部系统架构的问题,或根据产品手册完成一个配置任务。

l  模块六:多Agent系统与协作模式

Ø  为何需要多Agent系统:解决复杂任务、分工协作、模拟团队工作。

Ø  多Agent系统的架构模式:中心协调者模式、去中心化模式、层次化模式。

Ø  Agent间的通信与协作机制:消息传递、共享内存、黑板系统。

Ø  DeepSeek在多Agent系统中的应用:作为不同Agent的大脑,或作为协调Agent。

Ø  实战:设计一个简单的多Agent协作场景(概念设计或原型)

基于DeepSeek的LLM Agent开发 :原理、架构与实战(图2)  动手实践: 设计一个需要两个Agent协作完成的任务(例如,“需求分析Agent”与“代码生成Agent”协作)。讨论Agent间的职责划分和信息传递方式,并可能实现一个简单的原型来模拟其协作过程。

 

第三天:Agent开发高级话题与项目实践

l  模块七:Agent测试、调试与评估

Ø  测试Agent的挑战:非确定性、多步骤执行、与环境交互。

Ø  Agent的测试策略:单元测试(工具、记忆)、集成测试(组件协作)、端到端测试。

Ø  Agent的调试方法:日志记录、可视化执行路径、逐步跟踪。

Ø  Agent性能评估指标:任务完成率、准确率、效率、鲁棒性。

Ø  实战:Agent测试与调试实践

基于DeepSeek的LLM Agent开发 :原理、架构与实战(图2)  动手实践: 为之前构建的Agent编写测试用例,学习如何调试Agent的执行流程和工具调用问题。

基于DeepSeek的LLM Agent开发 :原理、架构与实战(图2)  模块八:Agent部署、运维与持续优化

Ø  Agent的部署架构考虑:同步调用 vs 异步调用、可伸缩性、高可用性。

Ø  在智算平台上部署Agent服务:容器化、服务管理。

Ø  Agent的监控与日志分析。

Ø  用户反馈收集与Agent的持续学习/优化。

Ø  版本管理与回滚策略。

Ø  实战:Agent部署与监控初步(概念演示或平台功能实践)

基于DeepSeek的LLM Agent开发 :原理、架构与实战(图2)  动手实践: 在平台上进行Agent服务的初步部署。学习如何查看Agent的运行日志和监控指标。

l  模块九:Agent安全、治理与主题项目实战

Ø  AI安全在Agent中的深度考量:

基于DeepSeek的LLM Agent开发 :原理、架构与实战(图2)  Agent的权限控制与访问管理:限制Agent可执行的操作范围。

基于DeepSeek的LLM Agent开发 :原理、架构与实战(图2)  防止恶意Prompt注入攻击Agent。

基于DeepSeek的LLM Agent开发 :原理、架构与实战(图2)  Agent行为约束与安全护栏(Guardrails)设计。

基于DeepSeek的LLM Agent开发 :原理、架构与实战(图2)  敏感信息处理与数据隐私保护。

基于DeepSeek的LLM Agent开发 :原理、架构与实战(图2)  Agent的可解释性与问责制。

Ø  Agent在企业内部的治理框架:审批流程、使用规范、风险评估。

Ø  大模型项目实战:深入构建客服机器人Agent或深度调研系统Agent

基于DeepSeek的LLM Agent开发 :原理、架构与实战(图2)  动手实践: 学员分组或个人选择一个主题(客服机器人或深度调研),在前两天学习的基础上,深入构建一个更完整、更健壮的Agent。重点关注:

基于DeepSeek的LLM Agent开发 :原理、架构与实战(图2)  复杂对话流程管理(客服)。

基于DeepSeek的LLM Agent开发 :原理、架构与实战(图2)  多源信息整合与推理(调研)。

基于DeepSeek的LLM Agent开发 :原理、架构与实战(图2)  错误处理与用户友好性。

基于DeepSeek的LLM Agent开发 :原理、架构与实战(图2)  结合RAG提供精准信息。

基于DeepSeek的LLM Agent开发 :原理、架构与实战(图2)  集成多个工具。

Ø  Agent技术的未来发展与在金融科技领域的创新应用展望。

Ø  总结与答疑。





返回上一级