课程介绍
随着大数据时代的快速到来,以及大数据在生产生活中迅速应用,数据分析、数据建模、数据挖掘等重要性越发突出,本课程是针对大数据时代的特点,尹老师总结多年企业级数据建模经验,而精心设计的课程,课程内容涵盖了数据领域的数据处理、统计分析、数据挖掘、机器学习等知识。其中案例通过当前流行的数据分析工具ERWIN实现。本课程是尹老师多年工作经验的总结和归纳,使学员从实操层面提升到数据挖掘理论层面,使学员深入理解数据分析、解读图表数据、数据建模等数据分析技术。
接下来的课程为大家呈现数据建模核心技术,为企业的IT战略发展提供参考。
课程目标
1、 让学员掌握金融行业业务建模(A/B/C)的方法和思路;
2、 使学员具备数据分析与建模等能力;
3、 使学员具备承接业务建模成果(企业级C模型),制定C'和D模型的能力;
4、 使学员具备构建企业级数据字典的能力;
5、 使学员具备主流建模工具(如:ERWIN)的操作实践的能力;
6、 数据分析与建模为企业管理者制定战略决策提供数据依据;
7、 使学员彻底理解数据模型的概念、技术、思维模式;
8、 使学员具备数据收集、数据挖掘、信息提取的能力;
9、 使学员具备绘制数据可视化图形的能力;
10、 使学员具备利用图形辅助思考的能力。
课程对象
即将投身于大数据、数据分析、数据挖掘领域的企业或者个人;
本课程适合于想通过数据化决策制定企业战略的决策者;
适合于经常需要汇报工作的管理者;
对数据可视化分析、数据可视化展现等感兴趣的人士;
对数据分析、数据挖掘算法等感兴趣的人士;
对ERWIN感兴趣的数据分析人士;
大型集团公司、大型网站、电商网站等数据挖掘、数据分析人员;
云计算、大数据从业者;
系统架构师、系统分析师、高级程序员、资深开发人员;
牵涉到大数据的数据中心运维、规划、设计负责人;
政府机关,金融保险、移动互联网、能源行业等大数据相关人员;
高校、科研院所统计分析研究员,涉及到数据处理的人员;
课程方式
以课堂讲解、演示、案例分析为主,辅以互动研讨、现场答疑、学以致用。
课程大纲
第一天
第1个主题: 金融行业业务建模(A/B/C)的方法和思路(深入剖析金融行业业务建模(A/B/C)的方法和思路)(120分钟)
1、 金融行业业务特点剖析
2、 金融行业业务建模(A/B/C)的方法和思路
3、 A卡(Application score card)申请评分卡
4、 B卡(Behavior score card)行为评分卡
5、 C卡(Collection score card)催收评分卡
6、 建立开发目标、方法及业务问题的定义
7、 确定数据源,选取样本
8、 数据抽取、清理和整理,建立数据集
9、 数据分析、变量选择及转换
10、 创建评分模型
11、 模型检验
12、 建立MIS报表,模型的实施、监控及调整
13、 运用信用评分卡需要注意的问题
第2个主题: 数据建模常用模型(介绍数据建模常用模型)(120分钟)
1、 数据建模的基本任务
2、 数据建模过程
a) 定义挖掘目标
b) 数据取样
c) 数据探索
d) 数据预处理
e) 挖掘建模
f) 模型评价
3、 常用的数据建模模型
a) 回归(预测)与分类
b) 决策树与随机森林
c) 聚类分析
d) 关联规则
e) 时序模式
f) 离群点检测
4、 案例:金融业用户借记卡聚类分析案例分享
第3个主题: 承接业务建模成果(企业级C模型)制定C'和D模型的能力(深入剖析承接业务建模成果(企业级C模型)制定C'和D模型的能力)(120分钟)
1、 企业级C模型概念
2、 企业级C模型
3、 企业级C模型分析
4、 企业级C模型应用场景
5、 企业级C模型参数
6、 损失函数
7、 ERWIN企业级C模型实现
8、 ERWIN企业级C模型检验
9、 案例实操:ERWIN企业级C模型实现金融业销售额预测
第二天
第4个主题: 制定C'和D模型的能力(深入剖析制定C'和D模型的能力)(60分钟)
1、 C'和D模型需求分析
2、 C'和D模型的原理
3、 制定C'和D模型的能力
4、 ERWIN实现C'和D模型的制定能力
第5个主题: 构建企业级数据字典(深入剖析构建企业级数据字典)(30分钟)
1、 企业级数据特征
2、 构建企业级数据字典
3、 企业级数据特征提取
4、 模型数据打标签
5、 特征构建
6、 ERWIN实现构建企业级数据字典
第6个主题: 主流建模工具(如:ERWIN)的操作实践(介绍主流建模工具(如:ERWIN)的操作实践)(30分钟)
1、 主流建模工具(如:ERWIN)的操作实践
2、 主流建模工具(如:Python)的操作实践
3、 ERWIN各种模型实现
4、 案例实操:ERWIN实现金融行业数据建模
第7个主题: 数据建模概述(介绍数据建模中的机器学习与数据挖掘)(30分钟)
1、 数据建模概述
2、 机器学习概念
3、 机器学习算法剖析
4、 算法库分类
5、 算法库
第8个主题: 数据建模聚类分析与实现(深入剖析聚类分析以及通过聚类算法模型分析数据)(60分钟)
1、 聚类分析
2、 聚类算法
3、 ERWIN聚类实现及绘图
4、 Kmeans应用案例剖析
5、 离群点检测
6、 箱型图检验离群值
7、 盖帽法
8、 案例实操:ERWIN Kmeans实现金融业网点选址
第9个主题: 数据建模决策树分析与实现(深入剖析决策树分析以及通过ERWIN决策树模型分析数据)(90分钟)
1、 决策树分析
2、 决策树
3、 决策树构成要素
4、 决策树算法原理
5、 决策树法的决策过程
6、 决策树法的决策过程
7、 决策树算法
8、 ERWIN实现决策树分析
9、 ERWIN实现决策树分析
10、 案例实操:ERWIN决策树分析实现金融业业客户细分
11、 随机森林
第10个主题: 数据建模时序模式分析与实现(深入剖析时序模式分析)(60分钟)
1、 时序模式
2、 时间序列分析
3、 时间序列分析
4、 时间序列
5、 序列分析的三个阶段
6、 案例实操:ERWIN实现金融业销售总额时间序列建模