4006-998-758
3000+课程任你选择
Python for Machine Learning
研发学院 Python for Machine Learning 开课时间:2024-02-07
陈旸

阿里云MVP(最有价值专家)

CCF数据库专委

1. 清华大学计算机博士,九三学社成员,清华企业家协会YoungTEEC成员

2. 多次数据分析,算法比赛获奖经历,2次NOI一等奖,2次ACM亚洲铜奖

3. 在数据分析,人工智能,云计算领域较有影响力,阿里云MVP(授予AI领域),腾讯云TVP(授予AI、云计算领域),百度AI比赛教练,百度PPDE

4. 著有《数据分析》《SQL必知必会》,累计付费订阅人员超11.5万人,国内数据分析领域线上知识付费Top1


查看老师详情
课程内容

课程目标

1、  了解机器学习pipeline及常用算法

2、  掌握不同的业务场景下,算法模型的选用

3、  掌握分类算法在项目中的应用,比如个贷违约预测

4、了解前沿技术,比如强化学习、迁移学习等


课程大纲

模块1:机器学习算法基础

1.   什么是人工智能

 2.   机器学习的7步法

3.  十大经典机器学习(分类、聚类、链接分析、关联分析)

4.   AI中的数学基础(人工智能五大门派)

5.    机器学习的场景

 Ø 信贷违约预测

 Ø  交易反欺诈

Ø  银行产品购买预测

 Ø  资金流入流出预测

Ø  评分卡模型在贷前贷中贷后中的应用

Ø  中小微企业信贷决策(信贷审批、利率、额度)


 模块2:挖掘数据中的关联规则

1.    什么是关联规则

2.    支持度、置信度和提升度

3.    Apriori算法

4.    BreadBasket:面包店购物清单的关联分析

5.    MovieLens:电影分类中的关联分析

6.    MovieActors:电影演员中的关联分析

7.    数据相关性分析

8.    回归分析模型与使用

9.     Project:股票相关性分析

 

模块3:预测全家桶与机器学习神器

1.    常用预测(分类,回归)模型

2.     Project A:员工离职预测

3.    Project B:男女声音识别

4.     什么是集成学习

5.    GBDT原理

6.    XGBoost

7.     LightGBM

8.    CatBoost

9.    在Project中使用机器学习神器

10.  机器学习祖传参数

 

模块4:手把手带你进行个贷违约预测

1.    数据探索

2.    异常值处理

3.    特征衍生方法

Ø  交叉特征构造

Ø  数据源区分

Ø 时间类型特征处理

Ø  分类型字段特征构造

Ø 数值型字段特征构造

4.搭建违约预测Baseline

5.特征重要性查看




返回上一级