课程大纲:
重点介绍三个网络模型,用于自动驾驶中双目摄像头或单目摄像头的距离预估,经过一定的调研和简要实践,双目测量技术更稳健可靠,模型如下:
a) Stereo-RCNN (Stereo 3D Object Detection via Shape Prior Guide Instance Disparity Estimation).
b) Disp-RCNN (Stereo 3D Object Detection via Shape Prior Guide Instance Disparity Estimation)
c) DSGN (Deep Stereo Geometry Network for 3D Object Detection)
分享三个模型结束后;如果时间允许,摘取下面大纲中的若干感兴趣点进行技术分享:
第一节:卷积神经网络与高阶应用
Inception-V3/V4
ResNet、DenseNet
使用迁移学习实现蒙古文识别
获取中间隐层的特征及可视化
隐层特征的意义和使用
迁移学习的trick
学习率、衰减、冻结等问题
代码和案例实践:
数字图片分类
卷积核与特征提取
以图搜图
人证合一
卷积神经网络调参经验分享
猫狗大战详解
海量蒙古文识别
隐特征可视化及其应用
第二节:图像分割与视频分类
视频关键帧处理
卷积的位置不变形与图像定位的关系
物体检测与定位
RCNN,Fast-RCNN,Faster-RCNN,MaskRCNN
YOLOv4、SSD
UNet及其与残差网络的结合
FaceNet与特征
EfficientNet、EfficientDet
视频帧的目标定位
时空卷积网络
SlowFast
代码和案例实践:
人脸检测
OCR字体定位和识别
睿客识云
气象识别
视频分类的trick
政务大厅视频监控的真实系统
第三节:时间序列分析
ARIMA、时间序列分析
一维卷积、指数平均和滑动平均、
Prophet模型
MaxPooling做光滑
Attention
CNN+LSTM模型
Bi-LSTM双向循环网络
Keras函数式API与回调函数
代码和案例实践:
时间序列算法:自回归、移动平均和整合模型
股票走势可视化
突变点分析
股票预测模型建立
模型训练
预测与评估
第四节:循环神经网络RNN
语言模型Bi-Gram/Tri-Gram/N-Gram
分词算法的原理及类似应用
词性标注
语义关系抽取
词向量
文本分类:基于CNN和基于LSTM的方法比较
机器翻译:Seq2Seq的典型应用
Transformer、BERT等模型原理
文本摘要与信息抽取
阅读理解
问答系统
情感分析
代码和案例实践:
知识图谱:命名实体识别的实践
知识图谱:实体关系的判定与分类
HMM分词及CRF的异同
文本摘要的生成
智能对话系统和SeqSeq模型
阅读理解的实现与Attention
机器翻译
使用LSTM生成文本
第五节:生成对抗网络GAN
生成与判别
生成模型:贝叶斯、HMM到深度生成模型
GAN对抗生成神经网络
DCGAN
Conditional GAN
InfoGan
Wasserstein GAN
代码和案例实践:
图片生成
看图说话
哪些场景不适合用GAN?
指静脉识别与GAN的关系
对抗生成神经网络调参经验分享
第六节:强化学习RL
马尔科夫决策过程
贝尔曼方程、最优策略
策略迭代、值迭代
Q Learning
SarsaLamda
DQN,DoubleDQN
DuelingDQN
AC、A2C、A3C
策略梯度、DDPG、PPO
代码和案例实践:
OpenAI
飞翔的小鸟游戏
超级玛丽强化学习实现
吃豆人的强化学习实现
DQN的实现
AlphaGo、AlphaZero的算法原理
工业控制领域的真实强化学习案例(未公开)