4006-998-758
3000+课程任你选择
DeepSeek 大模型技术原理与产业实践
研发学院 DeepSeek 大模型
Tyler

Ø  阿里任职期间后负责阿里云多部门算法工作,操盘过多项国家级产业项目算法工作。曾在多家世界500强企业承担人工智能技术负责人工作,具备深厚的数据智能系统研究和架构经验,实战经验覆盖包括C端B端的用户和商业化产品;

Ø  负责团队内部的技术招聘和面试工作,累计面试千人。作为阿里云内部“布道师”参与多场内部培训

Ø  全国信息学联赛一等奖保送并毕业于哈尔滨工业大学(C9),已发表多篇国际顶会和期刊发表学术论文;申请并已公开的国家发明专利 18 项,国际专利1项;

Ø  中国计算机学会技术前线委员会数据科学特邀讲者;

Ø  中国计算机学会(CCF)技术前线委员会(TF)委员人工智能与模式识别会员会委员

Ø  中国信通院标准化技术专家编委,作为主要作者参与“生成式人工智能”以及“人工智能应用安全”相关行业标准制定,致力于持续提高所负责团队以及行业的工程伦理素养。

查看老师详情
课程内容


课程大纲


第一部分:DeepSeek 核心优势与技术解析

本部分深入探讨 DeepSeek 大模型的核心优势,包括其独特的战略选择和领先的技术创新。我们将剖析 DeepSeek 如何在众多大模型竞逐中脱颖而出,选择了一条独特的发展路径——不盲目追求模型规模,而是将重心放在计算资源效率的最大化和推理能力的稳步提升。我们将深入探讨 DeepSeek 是如何通过优化底层计算架构(如高效的分布式训练框架)和开发高效模型算法(如 Transformer 结构的改进),在有限资源条件下训练出卓越性能的大模型。此外,我们还将深入剖析 DeepSeek 在低成本训练和推理方面的独特优势,例如模型压缩(如剪枝、量化)、知识蒸馏、高效优化算法等关键技术的应用,以及这些优势如何使其在 AI 计算产业浪潮中脱颖而出,更好地契合实际应用场景的需求。

第二部分:R1 复杂推理:思维链的强大驱动力

本部分将聚焦 DeepSeek-R1 卓越的复杂推理能力。我们将深入解析 R1 的核心技术,包括大规模奖励模型(通过人类反馈学习,使模型更好地理解人类意图)、自监督推理优化(利用大量无标签数据进行预训练,提高模型的泛化能力)和局部路径优化(在推理过程中,对局部路径进行优化,提高推理效率)等。这些技术是 R1 在数学推理、编程任务、逻辑归纳等高难度任务上表现出色的关键所在,充分展示了其强大的复杂推理能力。同时,我们还将深入探讨 R1 如何在推理能力和成本之间找到最佳平衡点,使其在实际应用中发挥出更大的价值。

第三部分:DeepSeek 的市场竞争力与行业适配性

本部分将 DeepSeek 与 GPT、Claude、Gemini、Llama 等主流大模型进行全面对比,展示其强大的市场竞争力,尤其是在推理精度、任务泛化、响应时延、训练能效等方面的卓越表现。我们将深入分析 DeepSeek 在金融、医疗、自动化运维、教育等行业的高度适配性,以及其低成本和高性能如何在企业级 AI 方案中形成显著优势,从而展现其广阔的商业前景。

第四部分:DeepSeek 落地案例:赋能各行各业

本部分将通过 DeepSeek 在代码智能生成、精准搜索增强、智能问答系统优化等领域的众多成功案例,展示其在不同场景下的应用价值。我们将深入分析 DeepSeek 在 AI 工程化落地过程中所总结的关键挑战与策略,例如如何进行模型优化(如针对特定任务进行微调)、案例复盘与启示等,为行业提供宝贵的经验。

第五部分:DeepSeek 的未来发展方向

本部分将重点关注 DeepSeek 对 AI 计算未来趋势的洞察,例如未来 AI 计算将朝着多模态 AI(处理图像、文本、语音等多种数据)、智能体(AI Agent)决策优化(让 AI 像人类一样进行思考和决策)、低成本训练架构(降低大模型训练成本)等方向发展,以及 DeepSeek 如何积极进行技术创新,在这些领域进行布局。我们将探讨 DeepSeek 如何继续推动 AI 生态发展,赋能更广泛的产业应用。

第六部分:DeepSeek 大模型的低成本应用指南

本部分将为学员提供 DeepSeek 大模型的低成本应用指南。我们将深入剖析 DeepSeek 的各项优势,例如低成本、高性能、强大的复杂推理能力等,并结合实际案例,指导学员如何根据自身业务需求,寻找合适的应用场景。

第七部分:DeepSeek 大模型的局限性与应对策略

本部分将坦诚地指出 DeepSeek 大模型可能存在的局限性,例如在特定任务上可能不如其他模型,以及大模型本身存在的伦理和安全风险(如数据隐私、偏见等)。我们将引导学员如何持续关注 DeepSeek 的最新进展,全面评估其优缺点,并重视伦理和安全问题,采取有效措施加以应对,例如建立完善的数据安全管理制度,对模型输出进行审核等。

返回上一级