课程介绍
课程讲授人是从事数据挖掘、机器学习、深度学习项目管理的人员,带队完成了数十个AI项目,内容不仅包括深度学习、机器学习、数据挖掘等具体技术要点,也包括AI的整体发展、现状、应用、商业价值、未来方向等,涵盖内容非常丰富
课程大纲
第零节:人工智能技术地图总览
1、图像视频方向
目标检测/小目标检测/图像分类/情感识别/微表情识别/医学图像分析/图像语义分割/图像生成/图像检索/图像识别/目标跟踪/视频语义分割/视频语义分析
2、自然语言处理方向
场景主题/文本检索/文档分类/中文自动分词/词性标注/语法分析/自然语言生成/文本匹配/信息抽取/机器翻译/自动摘要/手写体和印刷体字符识别/舆情分析/问答系统/场景文字检测/语义理解
3、语音识别方向
语音识别/语音生成
4、综合与总结
数据分析如何进行
特征如何选择
第一节:数据准备和特征表示:以运动传感数据的用户分类为例
获取数据
训练、验证数据的处理
数据预处理
重力特征的滤波
小波去噪原理和调参
特征描述、特征向量、特征提取、特征增强
机器学习分类器设计
数据挖掘模型的指标和评价
第二节:数据预处理与特征工程
以新冠肺炎确诊病例数据分析介绍数据预处理的重要性
数据获取
数据预处理
特征工程
判断数据对结果预测的有效性
采集和取舍问题
线上实时计算
预测用户对业务套餐的订购情况
数据获取过程中避免“幸存者偏差”的方式
常见的结构化数据类型
样本选取
数据清洗
特征工程
可视化识别脏数据
识别错误方法
数据清洗缺失值和离群值
特征工程中的特征设计与加工
特征选择和重要度判断
特征降维
特征工程的案例分析
第三节:时间序列分析
ARIMA、时间序列分析
一维卷积、指数平均和滑动平均、
Prophet模型
预测饱和增长和较少
趋势突变点和自动监测
调整趋势的灵活性
指定突变点的位置
对假期和特征事件建模
季节性的傅里叶级数
自定义季节性、节假日等先验信息
乘法和加法的时序建模区别
趋势、季节的不确定性
异常值的处理
MaxPooling做光滑
Attention
CNN+LSTM模型
Bi-LSTM双向循环网络
Keras函数式API与回调函数
代码和案例实践:
时间序列算法:自回归、移动平均和整合模型
股票走势可视化
突变点分析
股票预测模型建立
模型训练
预测与评估
数据分析与建模详细案例分析
1、用户留存分析与预估
2、网络运维中吞吐量估计与误差分析
3、小区流量统计与分析
4、客户贷款数据的风险分析和建模与评价
5、各种机器学习模型的调参经验分享
6、模型评价及其意义