上下文工程赋能技术全链路：构建高可靠、可治理的生产级LLM智能体

上下文工程赋能技术全链路

研发学院上下文工程赋能技术全链路：构建高可靠、可治理的生产级LLM智能体

Tyler

Ø 阿里任职期间，先后负责阿里云多部门算法工作，操盘过多项国家级产业项目算法工作。曾在多家世界500强企业承担人工智能技术负责人工作，具备深厚的数据智能系统研究和架构经验，实战经验覆盖包括C端B端的用户和商业化产品；

Ø 负责团队内部的技术招聘和面试工作，累计面试千人。作为阿里云的内部“布道师”参与多场内部培训。

Ø 全国信息学联赛一等奖保送并毕业于哈尔滨工业大学（C9），已发表多篇国际顶会和期刊发表学术论文；申请并已公开的国家发明专利 18 项，国际专利1项；

Ø 中国计算机学会技术前线委员会数据科学特邀讲者；

Ø 中国计算机学会（CCF）技术前线委员会（TF）委员，人工智能与模式识别会员会委员；

Ø 中国信通院标准化技术专家编委，作为主要作者参与“生成式人工智能”以及“人工智能应用安全”相关行业标准制定，致力于持续提高所负责团队以及行业的工程伦理素养。

查看老师详情

课程内容

课程介绍：

面向具备LLM和API开发经验的资深工程师、架构师及技术管理者。课程聚焦于设计、构建和运维大规模、跨领域、高可用的LLM智能体系统。核心内容涵盖从第一性原理出发的上下文工程，到多智能体协作与编排、多模态知识融合、运行时优化、自动化评估与治理，最终落脚于金融科技等高约束行业的复杂场景解决方案与迭代方法论。

课程大纲：

第一部分：提示语工程 (Prompt Engineering)

目标：掌握与大模型高效沟通的底层逻辑与高级技巧，使其能精准、稳定地完成复杂研发任务。

模块一：DeepSeek大模型核心技术与交互基础

技术演进与DeepSeek优势：从Transformer到MoE，聚焦DeepSeek在代码领域的模型结构、训练数据、上下文窗口优化及指令跟随能力的深度解析。
API与关键参数调优：深度讲解temperature, top_p, frequency_penalty等参数如何协同作用，影响代码生成的确定性、创造性与合规性。
实战：通过API调用，系统性对比不同参数组合对代码生成、逻辑推理和文本补全的具体影响。

模块二：高级提示语设计与复杂推理

思维链（CoT）及其变体：掌握Zero-shot CoT, Few-shot CoT等技术在复杂算法设计、问题排查中的应用。
高级推理框架：探索自洽性（Self-Consistency）、思想树（Tree-of-Thought）等方法，提升代码生成质量与问题解决的鲁棒性。
结构化输出与工作流编排：学习如何设计Prompt以获得稳定的JSON、Markdown等格式化输出，并利用Prompt Chaining技术将多个任务串联成自动化工作流。
实战：设计并优化一个多步骤、高要求的Prompt，解决一个真实的研发难题（例如：根据模糊需求生成详细的API设计文档及代码框架）。

模块三：代码全生命周期中的提示语应用

代码理解与分析：利用Prompt进行复杂代码的功能解释、逻辑梳理和潜在Bug分析。
代码重构与优化：让模型提供代码重构建议、性能优化方向，并辅助进行Code Review，自动生成评审意见。
实战：选取一段业务核心的复杂代码，使用Prompting技术进行深度分析，找出至少三个可优化点，并生成重构后的代码。

第二部分：知识工程 (Knowledge Engineering)

目标：掌握RAG核心技术，学会构建、管理和应用企业内部的研发知识库，解决大模型的幻觉和知识局限问题。

模块四：RAG技术架构深度解析

RAG核心价值：精准解决大模型知识滞后、幻觉频发及无法利用私有知识三大痛点。
架构全景图：从知识源处理、Embedding模型选型，到向量数据库（Vector DB）的索引策略、混合检索（Hybrid Search），再到生成器的上下文整合策略，全面解析RAG技术栈。
实战：使用合适的Embedding模型处理代码片段和技术文档，导入向量数据库，并进行多种检索策略（如关键词、向量、混合）的性能对比。

模块五：构建企业级多模态研发知识库

知识抽取与结构化：从代码（函数、类）、文档（Wiki、Confluence）、Issue中自动提取关键信息。
多模态RAG：融合文本、结构化数据（NL2SQL）、图知识（GraphRAG），构建统一的知识融合层，提供更丰富的上下文。
知识治理：探讨研发知识库的数据治理、版本控制、权限管理和动态更新策略。
实战：设计并初步实现一个小型项目知识库的构建流程，整合代码、Markdown文档和数据库表结构，支持统一的自然语言查询。

模块六：RAG在核心研发场景的深度应用

智能Codebase问答：构建一个能精准回答“这个函数如何使用？”、“处理某某异常的最佳实践是什么？”等问题的内部技术问答机器人。
Bug定位与修复辅助：利用RAG检索历史Bug报告、修复方案及相关代码上下文，加速故障排查。
架构理解与文档生成：基于代码和现有文档，通过RAG辅助新人快速理解大型复杂系统。
实战：搭建一个RAG驱动的内部技术问答机器人原型，并针对特定模块进行提问测试与调优。

第三部分：上下文工程与智能体 (Context Engineering & AI Agents)

目标：建立系统思维，掌握构建、编排和治理多智能体（Multi-agent）系统的核心能力，将AI从“工具”升级为“数字员工”。

模块七：上下文工程：Agent的感知中枢

上下文的体系化认知：理解“上下文预算（Context Budget）”，建立成本-延迟-准确性的权衡框架，分析上下文不足、污染等核心失败模式。
多源上下文建模与调度：对开发者指令、用户上下文、外部知识（RAG）、历史记忆进行统一建模与优先级调度。
上下文供应链安全：确保工具调用Schema的版本控制和PII（个人敏感信息）的自动脱敏。
实战：设计一个支持优先级、超时淘汰和合规过滤的多源上下文调度器（概念验证）。

模块八：Agent架构与多智能体协作

从单体到多智能体：掌握路由策略（语义、功能路由），以及中心化（Orchestrator）与去中心化（Choreography）的控制模式。
主流多智能体框架剖析：以Microsoft AutoGen为例，深入理解其可编程的智能体设计哲学，并与其他框架（如CrewAI）进行对比。
多智能体协作模式：学习分层、对话/辩论、市场竞拍等协作模式，并应用于复杂任务拆解与执行。
实战：基于AutoGen构建一个自动化代码审查智能体群组，包含“需求理解Agent”、“代码分析Agent”、“规范检查Agent”和“报告汇总Agent”，协同完成Code Review任务。

模块九：AI赋能的工程化、度量与治理

全链路集成与可观测性：将AI能力嵌入IDE、CI/CD，并设计上下文流日志、工具调用跟踪、推理路径可视化等可观测性体系。
效能度量与评估：建立科学的AI赋能度量体系（如代码提交速度、Bug率），并利用LLM-as-a-Judge等框架进行自动化评估。
企业级治理框架：建立Prompt模板与元数据的全生命周期管理，引入AI物料清单（AI-BOM）实现安全审计与合规追溯。
总结与展望：探讨人机协作的最佳模式、AI安全与知识产权挑战，以及AI在软件工程领域的未来趋势。

返回上一级

课程时长

2天

课程排期

待定

我要报名我要分享

课程推荐

返回上一级