课程大纲
一、大模型与DeepSeek简介
1. 大模型的概念及其发展历程
2. DeepSeek V3 模型架构,MoE、MLA、混合精度优化等关键技术与工程优化
3. DeepSeek R1 系列模型训练过程:“纯”强化学习、冷启动数据和模型蒸馏
二、DeepSeek在企业落地的技术方案
1. 云端部署:DeepSeek官方平台API调用、第三方MaaS服务
2. 本地化部署:算力评估、开源模型部署环境搭建
3. API:典型DeepSeek部署环境的API
4. DeepSeek企业级应用基本架构及关键技术:RAG、GraphRAG、AI Agent、微调训练等
三、思维链蒸馏与强化学习
1. 从 R1 和 s1 看大模型强化学习与思维链蒸馏的正确方法
2. 思维链蒸馏及微调环境搭建:讲解如何搭建蒸馏DeepSeek R1微调“小”模型的环境
3. 强化学习环境搭建:讲解DeepSeek创新的“纯RL”在企业里的应用场景,以及如何根据企业业务需求搭建强化学习环境
4. 思维链蒸馏与强化学习在企业的应用场景
四、用DeepSeek赋能企业研发智能化
1. 在企业内网搭建与应用基于DeepSeek的AI Coding环境
2. 已有AI Coding工具的不足、CodeGraphRAG技术及在企业软件研发智能体中的应用
3. 基于 DeepSeek R1 的代码审查助手
4. 基于 DeepSeek V3 的 UI 测试助手
五、行业影响与未来趋势
1. 全球与国内大模型及相关领域竞争态势及行业影响
2. 出口管制、数据安全、信创方案及对未来技术发展的影响
3. 新业务、新岗位、新就业与企业转型