4006-998-758
3000+课程任你选择
DeepSeek R1
研发学院 DeepSeek R1
Tyler

Ø  阿里任职期间后负责阿里云多部门算法工作,操盘过多项国家级产业项目算法工作。曾在多家世界500强企业承担人工智能技术负责人工作,具备深厚的数据智能系统研究和架构经验,实战经验覆盖包括C端B端的用户和商业化产品;

Ø  负责团队内部的技术招聘和面试工作,累计面试千人。作为阿里云内部“布道师”参与多场内部培训

Ø  全国信息学联赛一等奖保送并毕业于哈尔滨工业大学(C9),已发表多篇国际顶会和期刊发表学术论文;申请并已公开的国家发明专利 18 项,国际专利1项;

Ø  中国计算机学会技术前线委员会数据科学特邀讲者;

Ø  中国计算机学会(CCF)技术前线委员会(TF)委员人工智能与模式识别会员会委员

Ø  中国信通院标准化技术专家编委,作为主要作者参与“生成式人工智能”以及“人工智能应用安全”相关行业标准制定,致力于持续提高所负责团队以及行业的工程伦理素养。

查看老师详情
课程内容

程背景:

本课程旨在为学员构建一个全面、系统化的 AIGC (AI-Generated Content) 知识体系,从宏观生态趋势到微观技术核心,再到前沿开发实践,全方位赋能学员掌握 AIGC 时代的核心竞争力。课程将深入剖析 AIGC 生态系统的构成与发展脉络,聚焦于前沿大语言模型 DeepSeek R1 的核心技术,并结合最新的多智能体(Multi-Agent)和 LLMOps 框架,培养学员的实际应用与开发能力。

课程收益

系统化认知: 全面了解 AIGC 的生态体系,洞悉其产业格局与未来发展趋势。

核心技术掌握: 深度掌握大语言模型 DeepSeek R1 的架构原理、关键技术及应用优势。

实践能力培养: 熟练运用 AutoGen、MetaGPT 和 Dify 等前沿框架,具备构建和运营复杂 AIGC 应用的实战能力。

课程大纲:

模块一:AIGC 生态体系与发展趋势

本模块将从宏观视角出发,帮助学员建立对 AIGC 领域的整体认知,理解其商业价值和未来走向。

  • 第一讲:AIGC 概念与核心应用领域

    • AIGC       的定义、发展历程与关键里程碑

    • 文本、图像、音频、视频等领域的 AIGC 应用实例剖析

    • AIGC       对不同行业(如传媒、娱乐、教育、金融等)的颠覆性影响

  • 第二讲:当前 AIGC 产业格局与主要玩家

    • 全球及中国 AIGC 市场概览

    • 顶尖科技公司 (如 Google, OpenAI, Meta, Anthropic) 与新兴力量 (如 DeepSeek, Mistral AI) 的战略布局

    • 开源社区与闭源模型的发展现状与对比

    • AIGC       领域的投融资趋势与创业机会

  • 第三讲:AIGC 未来发展趋势与前沿技术展望 (2025-2030)

    • 多模态融合:从文本到音视频的无缝生成

    • Agentic       AI:自主智能体的兴起与应用 (为模块三做铺垫)

    • 端侧 AI:模型轻量化与边缘计算的结合

    • AI 安全、伦理与治理:技术发展面临的挑战与应对

 

模块二:大语言模型 DeepSeek R1 核心技术

本模块将深入技术内核,以备受瞩目的 DeepSeek R1 模型为例,解构其设计思想与技术创新。

  • 第四讲:DeepSeek R1 模型架构与核心原理

    • 深入解读 Transformer 架构的演进

    • 核心技术一:专家混合(Mixture-of-Experts, MoE)架构

      • MoE        的工作原理与优势

      • DeepSeek        R1 如何通过 MoE 实现性能与效率的平衡

    • 核心技术二:强化学习驱动的推理能力

      • 超越监督微调(SFT)的强化学习(RL)路径

      • DeepSeek        R1 如何通过 RL 激励模型的复杂推理与自我反思能力

  • 第五讲:DeepSeek R1 的关键技术特性与性能优势

    • 多令牌预测(Multi-token Prediction):提升推理速度的关键

    • 在数学、编程与逻辑推理等领域的卓越表现及评测数据分析

    • 与其他顶尖模型(如 GPT-4o, Claude 3.5 Sonnet)的横向对比

    • 模型的潜在局限性分析(如推理速度、稳定性等)

  • 第六讲:DeepSeek R1 的实践应用与微调指南

    • 如何通过 API 有效调用 DeepSeek R1 模型

    • 针对特定任务进行模型微调(Fine-tuning)的基本流程与策略

    • 构建基于 DeepSeek R1 的知识问答、代码生成等应用的案例分享

    • 负责任 AI:在使用开源模型时需要注意的安全与伦理考量

模块三:多智能体与 LLMOps 开发框架

本模块聚焦于前沿实践,通过 AutoGen、MetaGPT 和 Dify 这三个各具特色的框架,将理论知识转化为可协同工作、可运营的复杂应用。

  • 第七讲:前沿开发范式:从单体应用到多智能体协同与 LLMOps

    • AutoGen:       微软出品,灵活的多智能体对话框架,擅长构建可定制的、由对话驱动的复杂工作流。

    • MetaGPT:       将软件开发流程SOP化,通过为智能体分配不同角色(产品经理、工程师等)来自动化完成软件开发任务。

    • Dify:       一站式 LLMOps 平台,提供可视化界面,旨在简化 AI 应用的创建、部署、运营和监控,降低开发门槛。

    • 框架对比:AutoGen 的灵活性 vs MetaGPT 的结构化 vs Dify 的易用性。

  • 第八讲:使用 AutoGen 构建多智能体协作系统

    • AutoGen       核心概念:可对话的智能体 (Conversable Agents)、用户代理智能体 (UserProxyAgent)、助手智能体       (AssistantAgent)。

    • 实战一: 搭建一个“研究员-评论员”双智能体系统,自动完成信息搜集和观点总结。

    • 实战二: 设计一个包含“人-在-环路”(Human-in-the-loop) 的工作流,实现人机协作。

    • 探索 AutoGen Studio:通过低代码界面快速原型化多智能体应用。

  • 第九讲:使用 MetaGPT 实现软件开发自动化

    • MetaGPT       核心理念:SOPs (标准作业程序) 与角色扮演。

    • 理解 MetaGPT 的工作流程:从一行需求输入到生成用户故事、架构设计、代码和文档。

    • 实战三: 输入一个简单的应用需求(如“开发一个命令行贪吃蛇游戏”),观察并分析 MetaGPT 生成的全过程产出物。

    • 探讨 MetaGPT 在快速原型验证和自动化代码生成方面的应用场景与局限。

  • 第十讲:使用 Dify 快速构建与运营 AI 应用

    • Dify       平台核心功能:可视化 Prompt 编排、知识库管理、插件集成、API 发布与监控。

    • 实战四: 在 Dify 上创建一个基于知识库的智能客服机器人,无需编写代码。

    • 实战五: 将 DeepSeek R1 模型接入 Dify,并发布为可供调用的 API 服务。

    • 课程总结与结业项目指导:结合所学,选择合适的框架设计并实现一个完整的、可运营的 AIGC 应用。






返回上一级