课程大纲
大语言模型LLM简介
● 什么是大型语言模型?
● GPT系列模型概述
● chatGPT和GPT的关系
● AIGC和LLM的关系
● 开源模型 vs 闭源模型
● 公域模型 vs 私有部署
● DeepSeek和传统大模型的主要区别
● 预训练 vs 后训练
● 单模态 vs 多模态
● AIGC的三大应用领域
● 应用案例和潜在能力
● 实战案例演示(文本生成+文生图)
大语言模型LLM的基本原理
● 大语言模型“大”在哪里
● 大语言模型的基本原理
● 大语言模型的训练过程
● chatGPT的三阶段训练
● DeepSeek基于推理提升模型能力的基本原理
● 大语言模型的不可解释性
● 大语言模型和搜索引擎的区别与联系
● 大模型环境问题的正确理解与应用
● 数据为王:知识工程的回归
大语言模型本地部署实战
● 本地部署的基础知识
● 本地安装ollama
● 本地部署Deepseek R1
● 本地部署Llama 3.3
● 本地安装open-webui
● 本地部署实现RAG
如何使用好LLM
● 什么是提示词工程?
● 如何构建有效的提示
● LLM应用能力的进阶模型(“倒三角”模型)
● 提示词工程基础知识
● 主流提示词使用技巧
● 提示的万能使用公式详解
● 提示词模板的使用
● 提示词静态链的使用
● 提示词的横向扩展
● 提示词的纵向扩展
● 使用OpenAI API
● ReAct的概念和落地
● 思维链和多思维链
● RAG的基本原理与应用
● 多模态RAG的使用
● plugin机制与使用方式
● Function Call机制与使用方式
● Agent的雏形
● Agent开发的基本框架
● 业界主流Agent的设计思路与使用
● Multi-Agent的雏形
● 业界主流Multi-Agent的设计思路
● Multi-Agent的基本逻辑和应用范围
● Multi-Agent应用示例:MetaGPT
● Multi-Agent应用示例:DevChat
DeepSeek大模型基础与使用进阶
● DeepSeek与传统LLM的主要区别
● 从DeepSeek R1 Zero到DeepSeek R1
● DeepSeek R1和OpenAI O1模型的对比总结
● 预训练范式 vs 推理计算范式
● 多头潜在注意力机制MLA
● 混合专家架构MoE
● DeepSeekMoE的关键创新
● 对传统大模型的挑战和机遇
● DeepSeek的常见误解与详细解读
LLM在软件研发全生命周期中的应用场景与案例(独家干货,来自大厂一线落地实践)
● 软件研发全流程中LLM擅长的部分
● 软件研发全流程中LLM不擅长的部分
● 竞品分析与市场调研阶段LLM的应用场景与案例
● 产品概念与产品定义阶段LLM的应用场景与案例
● 产品原型阶段LLM的应用场景与案例
● 产品体验设计阶段LLM的应用场景与案例
● 需求分析阶段LLM的应用场景与案例
● 技术选型阶段LLM的应用场景与案例
● 顶层设计阶段LLM的应用场景与案例
● 详细设计阶段LLM的应用场景与案例
● 从设计到UML,从UML到代码的完整示例
● 编码阶段LLM的应用场景与案例
● 代码评审阶段LLM的应用场景与案例
● 单元测试阶段LLM的应用场景与案例
● 接口测试阶段LLM的应用场景与案例
● 持续集成流水中LLM的应用场景与案例
● 各类软件工程文档中LLM的应用场景与案例
● 持续发布中LLM的应用场景与案例
● 性能测试阶段LLM的应用场景与案例
● 测试结果分析中LLM的应用场景与案例
实战演练与案例分享
● 千行百业中的真实案例实战(各类实现干货案例)
● 从需求到解决方案的完整过程
● 行业大语言模型使用现状与限制
● 互联网大厂BAT的研发效能实践与产品化
● 软件开发中的实战案例
软件测试中的实战案例