课程介绍
随着大数据时代的快速到来,以及大数据在生产生活中迅速应用,数据的重要性突现,数据分析与数据挖掘等技术已经被越来越多的企业所重视和应用。数据分析与数据挖掘技术涵盖了数据采集、数据处理、统计分析、数据挖掘、机器学习、人工智能、大数据等各种不同技术与内容,涉及内容广泛,应用价值高,前景非常广阔。本课程是尹老师多年数据分析、数据挖掘工作经验的总结和归纳,从实际业务案例为入口,使学员从理论层到实操层面系统的学习数据分析技术,使学员深入理解数据分析。通过本课程的学习,学员即可以正确的分析企业的数据,为管理者、决策层提供数据支撑。
本课程重点讲解的数据分析方法、数据挖掘基础知识、数据建模方法和应用、机器学习算法、数据可视化方法、数据分析工具,并通过Python数据分析工具完成数据分析,理念与动手实践相结合,让学员通过实践深入理解数据分析与数据挖掘。
培训目标
介绍数据分析基础及理论、数据挖掘基础和理论、算法、常用工具,在工作中如何应用数据分析;
介绍数据分析建模、数据挖掘建模的方法和技巧;
介绍Python数据分析应用、 数据分析图表;
介绍统计分析基础和理论知识,包括概率统计的概念、术语和基本统计的算法等;
使学员具备分析企业业务数据的能力,提高分析数据、发现问题的能力,提高工作效率;
使用Python数据分析工具实现数据挖掘与数据分析与建模;
使学员具备数据分析与建模为企业管理者制定战略决策提供数据依据;
使学员深入理解数据分析与数据模型的概念、技术、思维模式;
使学员具备数据收集、数据挖掘、信息提取的能力;
介绍数据可视化,使学员具备利用图形辅助思考的能力;
培训对象
即将投身于大数据、数据分析、数据挖掘领域的企业或者个人;
本课程适合于想通过数据化决策制定企业战略的决策者;
适合于经常需要汇报工作的管理者;
对数据可视化分析、数据可视化展现等感兴趣的人士;
对数据分析、数据挖掘算法等感兴趣的人士;
大型集团公司、大型网站、电商网站等数据挖掘、数据分析人员;
云计算、大数据从业者;
系统架构师、系统分析师、高级程序员、资深开发人员;
牵涉到大数据的数据中心运维、规划、设计负责人;
政府机关,金融保险、移动互联网、能源行业等大数据相关人员;
高校、科研院所统计分析研究员,涉及到数据处理的人员;
培训方式
以课堂讲解、演示、案例分析为主,辅以互动研讨、现场答疑、学以致用。
课程大纲
时间 | 内容 | 备注 |
第一天 | 第1个主题: 数据分析基础及理论(深入剖析数据数据分析与数据挖掘的过程与方法,介绍数据建模中的机器学习与数据挖掘)(30分钟) 1、 数据分析与建模的概念 2、 数据分析与建模过程 3、 数据分析模型开发过程 4、 数据建模概述 5、 机器学习概念 6、 机器学习算法剖析 7、 算法库分类 8、 算法库 9、 深度学习 10、 神经网络 11、 人工智能 12、 商业智能
第2个主题: 数据挖掘基础理论和应用(介绍数据挖掘基础理论和应用)(30分钟) 1、 数据挖掘的基本任务 2、 数据挖掘建模过程 a) 定义挖掘目标 b) 数据取样 c) 数据探索 d) 数据预处理 e) 挖掘建模 f) 建立模型 g) 业务理解 h) 模型拟合 i) 训练集 j) 测试集 k) 模型评价 3、 常用的数学预测模型 4、 案例:如何从数据中挖掘出有价值的信息
第3个主题: 数据预处理(剖析数据预处理技术)(30分钟) 1、 数据分析挖掘的过程 2、 建立数据库的方法 3、 企业对数据分析挖掘的错误认识 4、 有效运用数据为客户提供针对性、主动化服务(精准营销) 5、 数据源 6、 数据采集 7、 随机抽样 8、 数据去重 9、 数据缺失值处理 10、 检验数据逻辑错误 11、 离群点检测 12、 数据转换 13、 数据分组 14、 课堂实操:数据预处理案例讲解
第4个主题: 统计分析基础和理论知识(深入剖析统计分析基础和理论知识)(30分钟) 1、 统计学基本概念 2、 统计数据的计量尺度 3、 常用基本统计量 4、 集中趋势的描述指标 5、 离散趋势的描述指标 6、 中心极限定理 7、 大数定律 8、 数据的分布 9、 正态分布的特征 10、 偏度和峰度 11、 检测数据集的分布 12、 数据的分布拟合检验与正态性检验 13、 抽样标准 14、 假设检验 15、 T检验 16、 置信区间
第5个主题: 数据挖掘方法和工具应用(介绍数据挖掘方法和工具应用)(30分钟) 1、 Python语言数据分析工具 2、 R语言数据分析工具 3、 SPSS数据分析工具 4、 SAS数据分析工具 5、 EChart数据分析图表工具 6、 Excel数据分析图表工具 7、 Tableau数据分析图表工具 8、 QlikView数据分析图表工具
第6个主题: 数据分析图表(实践数据分析图表)(30分钟) 1、 常用的统计图制作 2、 散点图 3、 条图 4、 饼图 5、 线图和面积图 6、 经验分布函数 7、 直方图 8、 QQ图 9、 茎叶图 10、 雷达图 11、 离群点检测 12、 箱型图检验离群值 13、 盖帽法 14、 柏拉图制作 15、 仪表盘制作 16、 玫瑰图制作 17、 热力图制作 18、 地图制作 19、 文字云制作 20、 课堂实操:Python描述性统计分析实现
第7个主题: 数据分析建模方法和应用(深入剖析数据分析建模方法和应用)(30分钟) 1、 线性回归 2、 回归(预测)与分类 3、 决策树与随机森林 4、 聚类分析(kmeans) 5、 关联规则 6、 时序模式 7、 离群点检测 8、 深度学习 9、 人工智能 10、 神经网络 11、 课堂实操:Python数据分析建模方法和应用
第8个主题: 数据分析建模方法和应用(深入剖析数据分析建模方法和应用)(60分钟) 1、 数据分析建模方法和应用 2、 回归与分类 3、 回归分析概念 4、 线性回归模型及其参数估计 5、 一元线性回归 6、 一元线性回归模型 7、 一元线性回归模型求解参数 8、 损失函数 9、 求偏导 10、 回归方程的显著性检验 11、 残差分析 12、 误差项的正态性检验 13、 残差图分析 14、 统计推断与预测 15、 回归模型的选取 16、 穷举法 17、 逐步回归法 18、 岭回归分析 19、 Python一元线性回归 20、 金融案例:Python一元线性回归模型检验 21、 多元线性回归概述 22、 多元线性回归模型 23、 金融案例:Python多元线性回归实现
第9个主题: Python数据分析图片实践和应用(深入剖析Python数据分析图片实践和应用)(30分钟) 1、 常用的数据分析图表的开发 2、 数据分析图表的应用 3、 图片特征提取 4、 主成分分析 5、 课堂实操:Python实现数据分析图片实践和应用
第10个主题: 数据分析建模在保险中的应用(深入剖析数据分析建模在保险中的应用)(30分钟) 1、 数据分析建模在保险中的应用 2、 关联规则 3、 支持度与置信度 4、 关联规则挖掘的过程 5、 Apriori算法 6、 关联规则案例 7、 支持度与置信度计算 8、 案例:Python实现关联规则 9、 课堂实操:Python实现数据分析建模在保险中的应用分析
第11个主题: Python数据分析应用(深入剖析Python数据分析应用)(30分钟) 1、 Python数据分析应用 2、 时序模式 3、 时间序列分析 4、 时间序列分析 5、 时间序列 6、 序列分析的三个阶段 7、 课堂实操:Python实现时序模型分析 |