4006-998-758
3000+课程任你选择
DeepSeek 大模型技术解析与金融行业的应用
研发学院 DeepSeek 大模型技术解析与金融行业的应用
Tyler

Ø  阿里任职期间后负责阿里云多部门算法工作,操盘过多项国家级产业项目算法工作。曾在多家世界500强企业承担人工智能技术负责人工作,具备深厚的数据智能系统研究和架构经验,实战经验覆盖包括C端B端的用户和商业化产品;

Ø  负责团队内部的技术招聘和面试工作,累计面试千人。作为阿里云内部“布道师”参与多场内部培训

Ø  全国信息学联赛一等奖保送并毕业于哈尔滨工业大学(C9),已发表多篇国际顶会和期刊发表学术论文;申请并已公开的国家发明专利 18 项,国际专利1项;

Ø  中国计算机学会技术前线委员会数据科学特邀讲者;

Ø  中国计算机学会(CCF)技术前线委员会(TF)委员人工智能与模式识别会员会委员

Ø  中国信通院标准化技术专家编委,作为主要作者参与“生成式人工智能”以及“人工智能应用安全”相关行业标准制定,致力于持续提高所负责团队以及行业的工程伦理素养。

查看老师详情
课程内容

课程目标

1. 全面解析 DeepSeek 大模型的技术原理,特别是其低成本优化策略与 R1 思维链推理技术。

2. 深入探讨 DeepSeek 在产业应用中的实际表现与部署优势。

3. 展望下一代 AI 计算架构,以及 DeepSeek 在其中的技术演进方向。


课程大纲 


第一部分:DeepSeek大模型技术架构与创新

  • DeepSeek的技术发展背景

    • 从V1到V3/R1的演进历程,如何通过技术创新提升计算效率与推理能力

    • DeepSeek独特的技术路径:最大化计算资源效率,在有限资源下实现高效性能

  • 核心技术解析

    • MoE架构(Mixture of Experts):通过专家模型分配优化计算资源,提高计算效率

    • MLA机制(Multimodal Learning Algorithm):强化多模态数据处理能力,提升推理精度与泛化能力

    • GRPO(Generalized Policy Optimization):采用GRPO算法增强模型的自我优化与决策能力,提升任务处理精度与适应性

    • Transformer架构优化:通过深度优化Transformer结构,提升训练效率与推理速度

  • 训练与推理优化

    • 分布式训练框架:高效的分布式训练方法与优化算法,加速大模型的迭代过程

    • 模型压缩与知识蒸馏:通过剪枝、量化等技术实现低成本推理与计算资源节约

    • 并行计算与推理加速:通过DP、TP、PP和EP并行策略提升训练效率,降低计算成本

第二部分:DeepSeek低成本推理与训练优化

  • 低成本训练与推理优化技术

    • DualPipe训练流水线:如何通过流水线结构大幅减少大模型训练的时延与能耗

    • MTP(Multi-Turn Prediction)推理优化:优化多轮推理过程,提升响应能力与效率

    • 硬件优化策略与推理加速:通过硬件调度与模型压缩技术,降低推理成本,提升处理速度

  • 计算资源消耗与推理效率的平衡

    • 通过智能调度与计算资源优化,如何确保DeepSeek在保证推理精度的前提下,降低计算消耗

    • 推理加速与成本优化技术,如何实现显著的推理性能提升并控制成本

第三部分:DeepSeek在金融行业的应用实践

  • DeepSeek在金融业务中的核心应用

    • 智能财报分析:如何利用DeepSeek分析大量财报数据,提取关键金融信息,辅助投资决策

    • 智能财富管家与投顾:利用DeepSeek提升投资组合优化与个性化金融推荐的决策精度

    • 风控与反欺诈:借助DeepSeek的推理能力,实现高效的风险预测与欺诈行为检测

  • 多模态数据处理与决策优化

    • 在金融场景中,如何利用DeepSeek进行多模态数据处理(如文本、表格、图像)来提升决策质量

    • 应用实例:如何将DeepSeek应用于智能合同质检、自动化估值等场景,提升金融业务的自动化和效率

  • 智能客服与AI助手的提升

    • 基于DeepSeek构建的智能客服系统如何提升响应速度和处理效率,优化客户体验

    • 深度集成DeepSeek于金融场景中的智能助手,提升企业服务能力与客户满意度

第四部分:DeepSeek大模型的行业适配与市场竞争力

  • 行业需求与DeepSeek的契合

    • 如何应对金融行业特有的复杂数据结构与快速变化的市场需求

    • DeepSeek如何在计算效率与推理能力之间找到平衡,满足金融行业多样化的应用需求

  • 与主流大模型的对比

    • 与GPT、Claude、Llama等主流大模型的性能对比,DeepSeek在推理精度、计算效率、任务适应性上的优势

    • 如何通过技术创新,增强DeepSeek在金融行业中的市场竞争力,提升行业影响力

第五部分:DeepSeek在金融行业的应用案例与前景

  • DeepSeek技术在金融行业的应用

    • 如何通过DeepSeek提升银行、保险、证券等金融机构的智能化服务,推动业务创新

    • 在智能投顾、反欺诈、风险控制等核心业务中,DeepSeek的技术如何改变传统金融业务模式

  • 未来发展趋势

    • 多模态AI与智能体决策优化:DeepSeek如何在金融行业引领多模态AI技术的应用,提升决策优化能力

    • 低成本大模型训练架构:未来如何进一步降低大模型训练成本,使其更好地适应金融行业的广泛应用需求

    • AI在金融行业的数字化转型:DeepSeek如何推动金融行业的智能化与数智化发展,提升行业整体效率

第六部分:互动与Q&A

  • 开放式讨论与现场问题解答

    • 深入探讨学员对于DeepSeek技术与应用的疑问,解决实际应用中的难题

    • 分享行业中的实际案例与技术难点,提供针对性的技术与应用优化建议

返回上一级