4006-998-758
3000+课程任你选择
模型原理与实战
研发学院 Transformer模型 chatGPT 开课时间:2024-02-07
邹伟

睿客邦创始人

中国软件行业协会专家委员

华东建筑设计研究总院研究员

山东交通学院客座教授

南昌航空大学校外硕士生导师

东北石油大学硕士生导师

天津大学创业导师

领导睿客邦与全国多所高校、国企建立了AI联合实验室,完成50多个深度学习实践项目,广泛应用于医疗、交通、农业、气象、银行、电信等多个领域,擅长利用AI技术解决工业、工程中的复杂问题。


查看老师详情
课程内容

课程介绍

课程讲授人是从事深度学习项目管理的人员,带队完成了数十个AI项目,内容不仅包括深度学习、机器学习、数据挖掘等具体技术要点,也包括AI的整体发展、现状、应用、商业价值、未来方向等,涵盖内容非常丰富。

邹伟,长春工业大学人工智能研究院院长,工程学术带头人、华东建筑设计研究总院研究员、山东交通学院客座教授、南昌航空大学硕士生导师、中国软件行业协会专家委员、上海市计划生育科学研究所特聘专家、天津大学创业导师、中华中医药学会会员、中国医药教育协会老年运动与健康分会学术委员;领导睿客邦与全国二十多所高校、国企建立了AI联合实验室,完成50多个深度学习实践项目,广泛应用于医疗、交通、农业、气象、银行、电信等多个领域。


课程收益

1,整体把握机器学习、深度学习、数据挖掘的发展方向

2,了解机器学习、深度学习、计算机视觉的技术框架

3,理解机器学习和深度学习的思维方式和关键技术

4,了解深度学习和机器学习在当前工业界的落地应用

5,了解AI顶会论文和最新技术热点


课程大纲

第一节:深度学习框架和卷积神经网络CNN

Pytorch框架介绍和环境搭建

Pytorch张量、卷积等基础知识

TensorFlow-Keras体系与PyTorch的对比

池化,激活函数,反向传播

目标分类与识别、目标检测与追踪

MLP多层感知机模型搭建与代码实现

AlexNet-VGGNet-GoogLeNet-ResNet-DenseNet

Inception-V3/V4-NasNet

代码和案例实践:

卷积核与特征提取

人证合一

卷积神经网络调参经验分享


第二节:Transformer模型

RNN-LSTM-GRU等基本概念

编码器、解码器

自注意力机制详解

Transformer

Mask Multi-Head Attention

位置编码

特定于任务的输入转换

无监督预训练、有监督 Fine-tuning

BERT思路的理解

GPT基本思想

GPT2:多任务系统

GPT3:少样本、零样本学习

meta-learning(元学习)和in-context learning(基于上下文的学习)

代码和案例实践:

基本问答系统的代码实现

深入阅读理解的代码实现

段落相关性代码实现

高考作文神器

作文生成


第三节:从GPT3到chatGPT

监督微调(SFT)模型、

指示学习和提示学习

简单提示、小样本提示、基于用户的提示

指令微调

RLLHF技术详解(从人类的反馈中学习)

聚合问答数据训练奖励模型(RM)

强化学习微调、PPO、

 InstructGPT遵循用户意图使用强化学习方案

Instruct Learning vs. Prompt Learning

ChatGPT增加增加了Chat属性

AI 系统的新范式

GPT1-GPT2-GPT3-InstructGPT的-chatGPT的技术关系

代码和案例实践:

使用chatGPT打造你的私人聊天助理

演示提示词技巧,翻译器润色器、JavaScript 控制台 、Excel Sheet

网站定制chatgpt-web


第四节:大模型中的强化学习

强化学习核心机制

深度学习和强化学习的结合

SARSA和Q-Learning

时序差分简介、TD目标值 / TD 误差

DP/MC/TD对比

在线策略TD:Sarsa算法

离线策略TD:Q-learning算法

表格型强化学习/函数近似型强化学习

值函数逼近的Sarsa算法、Q-learning算法

DQN

Double DQN方法

Dueling DQN方法

InstructGPT遵循用户意图使用强化学习方案

代码和案例实践:

AlphaGo的代码实现细节

策略梯度PG和PPO算法

RLHF:从人类的反馈中学习(经典论文学习)

DQN、DoubleDQN的路径优化实现


第五节:扩散模型

GAN-VAE-流模型-扩散模型的技术发展和变化

CLIP和扩散模型的结合:基于CLIP模型的多模态引导图像生成:图文引导

GLIDE:文本引导

Diffusion-CLIP模型

扩散和去噪(Diffusion&Denoise)

训练和采样(Training&Sampling)

离散步骤的马尔可夫链

分子热动力学的扩散过程

离散加噪

DDPM-最经典的扩散模型

DDIM:加速采样、可控扩散

IVLR:迭代去燥的图像编辑,低通滤波上采样

RePaint: 被掩码的区域进行扩散生成

代码和案例实践一:

低质量噪声图像修复

精确复原原图

图像去除遮挡、图像补全

图像生成(人物恢复青春、人物变瘦)


第六节: 扩散模型-图文引导图像生成

图像引导、文本引导、图像+文本引导

CLIP和扩散模型的结合:基于CLIP模型的多模态引导图像生成:图文引导

GLIDE:文本引导

DALL·E 2:diffusion model和CLIP结合在一起

隐式分类器引导的图像生成

Blended Diffusioni模型

DiffEdit模型

AIGC的可能应用领域和行业影响

本人在央企数字化转型中的实践体会

代码和案例实践:

实现图像引导、文字引导、图文引导下的图片生成

Diffusion LM

Diffusion-CLIP模型

知识图谱-图网络等“边缘技术”在AIGC中的应用






返回上一级