课程目标
1、 了解机器学习pipeline及常用算法
2、 掌握不同的业务场景下,算法模型的选用
3、 掌握分类算法在项目中的应用,比如个贷违约预测
4、了解前沿技术,比如强化学习、迁移学习等
课程大纲
模块1:机器学习算法基础
1. 什么是人工智能
2. 机器学习的7步法
3. 十大经典机器学习(分类、聚类、链接分析、关联分析)
4. AI中的数学基础(人工智能五大门派)
5. 机器学习的场景
Ø 信贷违约预测
Ø 交易反欺诈
Ø 银行产品购买预测
Ø 资金流入流出预测
Ø 评分卡模型在贷前贷中贷后中的应用
Ø 中小微企业信贷决策(信贷审批、利率、额度)
模块2:挖掘数据中的关联规则
1. 什么是关联规则
2. 支持度、置信度和提升度
3. Apriori算法
4. BreadBasket:面包店购物清单的关联分析
5. MovieLens:电影分类中的关联分析
6. MovieActors:电影演员中的关联分析
7. 数据相关性分析
8. 回归分析模型与使用
9. Project:股票相关性分析
模块3:预测全家桶与机器学习神器
1. 常用预测(分类,回归)模型
2. Project A:员工离职预测
3. Project B:男女声音识别
4. 什么是集成学习
5. GBDT原理
6. XGBoost
7. LightGBM
8. CatBoost
9. 在Project中使用机器学习神器
10. 机器学习祖传参数
模块4:手把手带你进行个贷违约预测
1. 数据探索
2. 异常值处理
3. 特征衍生方法
Ø 交叉特征构造
Ø 数据源区分
Ø 时间类型特征处理
Ø 分类型字段特征构造
Ø 数值型字段特征构造
4.搭建违约预测Baseline
5.特征重要性查看