4006-998-758
3000+课程任你选择
数据挖掘-通用课程
研发学院 数据挖掘
常国珍

CDA数据科学研究院院长

北京大学博士

中国大数据产业生态联盟专家委员会委员

腾讯云最有价值专家(TVP)

曾任思特沃克(ThoughtWorks)中华区首席数据科学家

毕马威(KPMG)咨询大数据总监

人民大学、对外经贸大学等多所高校外聘讲师

北京语言大学金融硕校外导师

具有20年金融行业数据分析、人工智能咨询服务经验

资深量化精准营销和风控专家

具有20年金融、电信、政务、能源、汽车、互联网的行业数据科学、数据治理咨询顾问经验。

资深数据资产管理、量化精准营销和风控专家。 协助企业逐步积累数据资产,运用数据智能工具优化业务流程,取得数字化竞争优势。


查看老师详情
课程内容


课程大纲


时间

授课模块

授课内容

第1天

1、数据挖掘基础

1.企业中数据分析的层级

2.数据挖掘方法论

3.数据挖掘的核心思维

4.算法建模的四个要素

5.算法模型分类介绍

6.数据挖掘落地场景框架

7.数据挖掘建模模型的评估

2、数据挖掘框架下再造回归算法

1.岭回归方法

2.LASSO回归算法

3.用Sklearn包实现以上回归算法的超参数调优

4.金融行业常用的几种广义回归模型

5.用线性回归做产品价值预测案例

6.用逻辑回归做保险精准营销案例

第2天

3、机器学习算法进阶

1. 决策树进阶精讲(分类树与回归树)

2. 欠拟合与过拟合专题

3. 模型训练与超参数搜索

4. 集成学习基础

5. 随机森林

6.某金融机构反欺诈建模案例

第3天

 

4、集成学习专题

1. XGBoost

2. LightGBM

3. 相关库的使用与参数说明

4. 进阶的超参数搜索方法(随机搜索,贝叶斯搜索等)

5. 数据类别不平衡专题

第4天

5、推荐算法、时间序列预测与特征工程

1. 推荐算法整体框架介绍

2. Apriori和FP-TREE算法及银行业应用案例

3. 时间序列ARIMA算法

4. 时间序列LSTM算法

5. 股票价格预测案例

6. 特征升维方法

7. 特征降维方法

8. 特征创新方法

第5天

6、异常识别算法与分类算法拓展

1.半监督学习KNN算法

2.贝叶斯生成式算法

3.局部异常因子和孤立森林算法

4.某金融机构反欺诈建模案例

5.支持向量机SVM算法

6.凸优化和SVM与GBDT公式推导

第6天

7、综合案例:信用评分卡构建全流程

 

1.使用LightGBM进行拒绝推断

2.特征筛选与WOE转化

3.特征降维

4.数据清洗

5.进行评分卡转换

6.模型评估:技术指标和业务指标

说明:使用toad或Scorecardpy包建立评分卡全流程,提供标准的信用评分卡制作模板


返回上一级