课程时长
1天(6小时/天)可根据模块压缩时长
课程大纲
第1部分 数据预处理和特征工程实践
数据探索
数据缺失值处理
数据异常值处理
分析训练集和测试集的特征分布
修正特征分布,提升预测分数
回归问题标签列
类别变量的处理
文本特征处理
第2部分 模型训练以及不均衡多分类和回归实践
特征和特征之间的关系分析
特征和标签之间的关系分析
新特征的构造和评估
构造新特征的工具
匿名特征构造和分析
特征选择方法和结果评估
第3部分 机器学习算法介绍和实践
聚类
分类
回归
关联
时间序列
神经网络和深度学习算法