课程目标:
通过课程学习,可以理解机器学习的思维方式和关键技术;了解深度学习和机器学习在当前工业界的落地应用;能够根据数据分布选择合适的算法模型并书写代码,初步胜任使用Python进行数据挖掘、机器学习、深度学习等工作。
课程特点:
课程重视代码实践,使用金融、气象、农业、交通、安防等工业界实际数据(数据已脱敏)进行机器学习模型的落地应用。虽然课程坚持推导公式,但更重视机器学习和深度学习的原理与实操;将实际工作中遇到的行业应用和痛点做最直观切实的展示;重视算法模型的同时,更强调实际问题中应该如何模型选择、特征选择和调参。
课程大纲:
第一节:Python Package与TensorFlow框架
解释器Python2.7/3.6与IDE:Anaconda/Pycharm
列表/元组/字典/类/文件
numpy/scipy/matplotlib/panda的介绍和典型使用
scikit-learn的介绍和典型使用
TensorFlow典型应用
典型图像处理
多种数学曲线
多项式拟合
快速傅里叶变换FFT
奇异值分解SVD
Soble/Prewitt/Laplacian算子与卷积网络
代码和案例实践:
卷积与(指数)移动平均线
股票数据分析
缺失数据的处理
环境数据异常检测和分析
使用TensorFlow设计分类器
使用TensorFlow完成线性回归
第二节:回归和随机森林
线性回归
Logistic/Softmax回归
广义线性回归
L1/L2正则化
Ridge与LASSO
Elastic Net
梯度下降算法:BGD与SGD
ID3、C4.5、CART详解
决策树的正则化
Bagging
随机森林
不平衡数据集的处理
利用随机森林做特征选择
使用随机森林计算样本相似度
异常值检测
代码和案例实践:
1.泰坦尼克号乘客缺失数据处理和存活率预测
2.环境检测数据异常分析和预测
3.模糊数据查询和数据校正方法
4.PCA与鸢尾花数据分类
5.二手车数据特征选择与算法模型比较
6.广告投入与销售额回归分析
7.鸢尾花数据集的分类
8.决策树和随机森林的可视化
9.葡萄酒数据集的决策树/随机森林分类
第三节:卷积神经网络CNN
神经网络结构,滤波器,卷积
池化,激活函数,反向传播
目标分类与识别、目标检测与追踪
AlexNet、VGGNet、GoogleLeNet
Inception-V3/V4
ResNet、DenseNet
RCNN,Fast-RCNN,Faster-RCNN,MaskRCNN
YOLO
FaceNet
代码和案例实践:
以图搜图
人证合一