4006-998-758
3000+课程任你选择
DeepSeek技术及应用实践v1
研发学院 DeepSeek
李明宇

中科院计算所副教授(高级工程师)

历任国家重点实验室课题组负责人

创业公司CTO、上市公司事业群技术总监和首席技术专家

荣获中国软件协会“优秀CTO”等多项荣誉

中国新一代IT产业联盟分委会秘书长

全国高校人工智能与大数据创新联盟专家委员

北京开源创新委员会委员

中国开源软件创新大赛总决赛评委

十余年来致力于IT新技术在企业的落地,作为项目技术负责人为多家知名企业和单位开发和交付过产品及服务,包括:国家信息中心、国防科技大学、中石化、银联、交通银行、首都在线、中国电信天翼爱音乐、中国移动研究院等。

在AI大模型领域,李老师在B端和C端均有AI应用从技术研发到落地变现的闭环实践经验,自研技术 CodeGraphRAG 性能达到国际领先水平。企业客户包括电信运营商、大型上市企业、国内知名芯片公司等,受到一致好评。

查看老师详情
课程内容


课程大纲


一、大模型与DeepSeek简介

1. 大模型的概念及其发展历程

2. DeepSeek V3 模型架构,MoE、MLA、混合精度优化等关键技术与工程优化

3. DeepSeek R1 系列模型训练过程:“纯”强化学习、冷启动数据和模型蒸馏

 

二、DeepSeek在企业落地的技术方案

1. 云端部署:DeepSeek官方平台API调用、第三方MaaS服务

2. 本地化部署:算力评估、开源模型部署环境搭建

3. API:典型DeepSeek部署环境的API

4. DeepSeek企业级应用基本架构及关键技术:RAG、GraphRAG、AI Agent、微调训练等

 

三、思维链蒸馏与强化学习

1. 从 R1 和 s1 看大模型强化学习与思维链蒸馏的正确方法

2. 思维链蒸馏及微调环境搭建:讲解如何搭建蒸馏DeepSeek R1微调“小”模型的环境

3. 强化学习环境搭建:讲解DeepSeek创新的“纯RL”在企业里的应用场景,以及如何根据企业业务需求搭建强化学习环境

4. 思维链蒸馏与强化学习在企业的应用场景

 

四、用DeepSeek赋能企业研发智能化

1. 在企业内网搭建与应用基于DeepSeek的AI Coding环境

2. 已有AI Coding工具的不足、CodeGraphRAG技术及在企业软件研发智能体中的应用

3. 基于 DeepSeek R1 的代码审查助手

4. 基于 DeepSeek V3 的 UI 测试助手

 

五、行业影响与未来趋势

1. 全球与国内大模型及相关领域竞争态势及行业影响

2. 出口管制、数据安全、信创方案及对未来技术发展的影响

3. 新业务、新岗位、新就业与企业转型


返回上一级