课程目标
帮助企业IT管理及研发、运维人员了解DeepSeek及其大模型技术的基本原理、核心优势与实际应用价值
- 探讨如何利用DeepSeek技术优化企业信息化建设和数字化转型
- 分析技术集成、部署策略及未来发展趋势,助力企业在激烈竞争中保持领先
课程对象
- 企业各级IT主管、部门负责人及CIO
- 信息系统研发和运维工程师
课程大纲
一、大模型与DeepSeek简介
1. 大模型技术概览
- 大模型的概念及其发展历程
- 目前全球主流大模型的特点及关键技术
- 大模型企业应用场景:知识管理、智能客服、软件研发、辅助决策等
2. DeepSeek简介
- DeepSeek 公司背景
- DeepSeek 的产品:从 V1 到 V3 再到 R1
- DeepSeek-V3 和 DeepSeek-R1 的区别与各自优势、R1的重要意义
二、DeepSeek核心技术解析
1. DeepSeek-V3 模型技术解析
- 模型架构与参数规模
- MoE、MLA、混合精度优化等关键技术与工程优化
- 训练流程及成本控制
2. DeepSeek-R1 模型解析
- 在DeepSeek-V3基础上,通过强化学习(RL)激发“链式思维”能力
- “R1-Zero”:纯RL训练的初步探索及存在的问题
- “R1”改进:引入冷启动数据、SFT+RL组合、语言一致性奖励等方法
- 开源模式及后续蒸馏小模型的部署优势
三、DeepSeek在企业的部署与应用
1. 部署架构与方案
- 云端部署:DeepSeek官方平台API调用、第三方MaaS服务
- 本地化部署:算力评估、开源模型部署环境搭建
- 蒸馏及微调:讲解如何搭建蒸馏DeepSeek-R1微调小模型的环境
- DeepSeek的纯强化学习环境搭建方案:讲解DeepSeek创新的“纯RL”在企业里的应用场景,以及如何根据企业业务需求搭建纯RL环境
2. API与应用开发
- API:讲解各DeepSeek部署环境的典型API方案
- DeepSeek应用的基本架构
- 提示词工程:介绍在企业级应用里如何结合业务场景构造不同类型的提示词,以及和个人使用场景的提示词设计的异同
3. 企业知识库与向量检索增强技术(RAG)
- 知识库/向量检索增强技术原理:解析RAG中向量空间模型、相似度计算原理;
- 结合实际案例讲解文本切割的原则和技巧,应用于上市公司财报分析、售前/售后技术支持等场景。
- 知识库构建中的图表处理和数据清洗
- RAG与知识图谱的结合以及GraphRAG
4. 智能体Agent架构与实现
- 智能体概念澄清:讲解智能体(Agent)的概念,并澄清一些误解
- 典型智能体架构:介绍基于LLM的智能体系统架构及其组成要素,以及常见的部署方案。
- AgenticRAG:结合检索增强生成技术,提高智能问答效果和准确度。
- 多智能体协作:多智能体协作方式和多智能体系统开发框架。
四、DeepSeek 企业落地案例剖析
1. 企业落地方案及应用案例(一)情报收集与分析
- 商业情报、公共舆情收集与分析的痛点
- RAG架构及基于DeepSeek V3的多模态情报库与智能问答系统构建
- 智能体架构的Agentic RAG技术及基于DeepSeek R1的情报分析
2. 企业落地方案及应用案例(二)企业级软件研发智能助手
- 企业级软件研发的痛点及已有AI Coding工具的不足
- CodeGraphRAG 技术及在企业软件研发智能体中的应用
- 基于 DeepSeek R1 的代码审查助手
- 基于 DeepSeek V3 的 UI 测试助手
3. 企业落地其他场景探讨
- 销售与运营数据分析、智能化设备运维助手、用户体验评估与升级等
4. 大模型互联网应用风险管理与供应商选择
- 内容和技术风险及应对策略
- 利用开源社区及生态寻找第三方DeepSeek合作伙伴
五、竞争格局、行业影响与未来趋势
1. 全球与国内竞争态势及行业影响
- 美国和其他国家在大模型和AI基础设施方面的投入现状
- 中国各大模型公司、云厂商及应用生态的竞争格局和发展趋势
- DeepSeek对美国科技股(如Nvidia)和中美风险投资市场影响
2. 未来趋势与战略思考
- 大模型时代是否已开启下半场?
- 出口管制、数据安全、信创方案及对未来技术发展的影响
- 新业务、新岗位、新就业与企业转型