4006-998-758
3000+课程任你选择
大模型技术与实践
研发学院 深度学习 NLP Attention 开课时间:2024-03-07
朱少民

 软件测试和质量保证领域资深专家,具有在国际性软件企业(Cisco/WebEx)、十年以上的技术管理经验。

8年的软件开发和项目管理经历,熟悉软件开发的主要技术,在互联网、通信、协作、电子政务等领域具有丰富的项目实践经验。

从零开始,打造了国内一流的测试团队(团队规模达260人),具有较强的组织、协调和管理能力,包括面试、培训、员工激励和绩效考核等方面的经验。

优秀的团队建设和领导能力,具有领导和管理不同类型团队的经验,如跨地区团队、快速发展团队、关键核心团队等。

在美国硅谷近两年的工作经验,掌握业界先进的思想和方法,了解西方文化,能够开展有效的国际交流。

在软件工程理论及其相关国际标准(如CMMI, ISO 9000)等方面有较高的造诣,擅长流程定义和改进、质量管理等工作。

 熟悉软件开发方法论和过程框架,熟悉各种软件开发环境,能有效地管理项目、控制成本和提高产品开发效率。


查看老师详情
课程内容

课程大纲:

第一天

深度学习基础知识

  • 深度学习基本概念和常见应用

  • CNN、RNN和LSTM

  • 机器学习基本流程讲解

  • 课上实战: Jupyter环境学习,使用CNN开发一个手写识别程序


NLP介绍和Attention机制,GPT介绍

  • Transformer 介绍

  • Zero-shot、few-shot 技术


Prompt案例实践,辅助营销、辅助写报告

  • Prompt 技术介绍

  • Prompt技巧

  • Prompt 工具实操

  • Prompt-NL2SQL

  • 被低估的 prompt

  • 实操练习: 使用 GPT完成作业


预训练技术与实操预训练:一个小型预训练流程

  • 目标和复现步骤的介绍

  • 第一阶段-数据准备

  • 第二阶段-环境准备

  • 第三阶段-关键算法和实战总结


微调技术与微调特殊需求讲解,API搭建

  • 模型微调的方法和实践

  • 开源大模型 Baichuan 微调实践

  • API服务部署

  • 前端调用

  • 流式读取

  • 统一API接口简化开发流程,缩短开发时间


对话机器人专题与实操练习

  • 对话机器人的分类与构成

  • 传统对话机器人方案

  • 大模型机器人实现方式

  • 以订餐对话机器人为例,拆开每段代码讲解如何实现一个任务型对话机器人


第二天

Iangchain技术,Agents技术与两个案例分享

Langchain技术

  • Langchain 技术介绍

  • 使用Langchain搭建一个 chatPDF 系统

  • LLM 融合结果

  • Langchain 技术框架的优缺点

  • Langchain 和开源大模型结合


金融智能知识库案例介绍与初步实现

  • 项目介绍

  • 离线处理


金融知识库比赛前九名经验&kaggle大模型比赛RAG经验详解-精华

  • 框架步骤

  • 其他环节优化经验


Agents技术与智能BI案例、智能水务案例

  • 大模型 Agents 技术的概述

  • 大模型Agents 技术的原理和模型

  • 智能 BI 案例

  • 智能水务案例介绍

互动与总结


返回上一级