课程目标
R语言入门基础;
R语言进行描述性分析;
市场调研与数据预处理技术;
透过现象看本质:回归分析;
最简单的机器学习算法 -K最近邻;
数学与科学的反映-贝叶斯网络;
分而治之的算法模型-决策树;
人工智能的底层模型-神经网络。
课程对象
对R语言感兴趣的数据分析人士;
对数据分析、数据挖掘算法等感兴趣的人士;
对数据可视化分析、数据可视化展现等感兴趣的人士;
适合于经常需要汇报工作的管理者;
本课程适合于想通过数据化决策制定企业战略的决策者;
课程方式
以课堂讲解、演示、案例分析为主,辅以互动研讨、现场答疑、学以致用。
课程大纲
时间 | 内容 | 备注 |
第一天 | 第1个主题: R语言基础知识与语法(课程目标:掌握R语言的基本知识与基础语法、用R编写函数)(120分钟) 1、 R语言历史与趋势剖析 2、 安装R语言 3、 RStudio使用 4、 工作空间的设置 5、 R程序包的载入与使用 6、 R资源网上查找方法介绍
第2个主题: R语言入门基础(介绍R语言基础语法)(120分钟) 1、 R语言的数据类型 2、 R语言的数据结构(向量、矩阵、数组、列表与数据框) 3、 循环语句 4、 条件语句 5、 遍历 6、 常用函数 7、 常用算法 8、 定性变量 9、 离散变量 10、 连续变量 11、 多元变量 12、 对向量、矩阵和列表进行运算 13、 提取和插入元素 14、 日期和时间数据的操作处理 15、 编写自定义函数解决复杂问题 16、 编程技巧 17、 编程案例介绍
第3个主题: R语言的绘图(课程目标:掌握R语言绘图函数,R语言的探索性分析与数据可视化)(120分钟) 1、 绘图函数 2、 散点图 3、 柱状图 4、 直方图 5、 图形增强函数 6、 图形互动函数 7、 高级绘图命令 | |
第二天 | 第4个主题: 市场调研与数据预处理技术(介绍市场调研与数据预处理技术)(90分钟) 1、 市场调研 2、 调研表格设计 3、 调研数据录入 4、 数据预处理技术 5、 数据的读入和输出 6、 R语言连接RDBMS数据库介绍 7、 数据库的读/写 8、 R和SQL的交互 9、 数据预处理 10、 日期和时间的处理 11、 因子变量的操作 12、 下标数据整理技术 13、 字符串操作 14、 数据子集的筛选 15、 识别重复数据和缺失值处理 16、 函数映射数据转换整理技术 17、 变量的重新编码 18、 plyr、reshape2等包整理数据
第5个主题: R语言进行描述性分析(掌握R语言用法和基本数据分析、数据描述统计分析)(90分钟) 1、 基本数据分析(随机数的生成和统计模拟) 2、 单变量数据分析与作图 3、 双变量数据分析与作图(二维表分析,并列箱线图,相关系数) 4、 多变量数据分析与作图(多变量相关系数矩阵) 5、 离群点检测 6、 案例1:汽车数据描述统计分析 7、 案例2:财政收入与税收描述统计分析
第6个主题: 透过现象看本质:回归分析(课程目标:透过现象看本质:回归分析)(90分钟) 1、 案例分享:透过现象看本质 2、 一元线性回归 3、 多元线性回归 4、 逐步回归 5、 logistic回归 6、 案例1:淘宝双十一销售额预测 7、 案例2:产品销量预测
第7个主题: 最简单的机器学习算法-K最近邻(深入剖析最简单的机器学习算法-K最近邻)(90分钟) 1、 K近邻法(KNN)原理 2、 k最近邻算法(kNN) 3、 kNN模型的三要素 4、 距离度量 5、 蛮力实现(brute-force) 6、 KD树实现(KDTree) 7、 球树(BallTree)实现 8、 搜索k近邻 9、 模型评估与调优方法 10、 分类算法的应用 11、 R语言代码实战: K近邻算法R语言实现 | |
第三天 | 第8个主题: 数学与科学的反映-贝叶斯网络(深入剖析贝叶斯网络算法的基本原理和实现)(90分钟) 1、 贝叶斯网络统计模型 2、 贝叶斯网络统计分析的基本思想 3、 贝叶斯网络统计模型 4、 贝叶斯网络统计推断原则 5、 先验分布的Bayes假设与不变先验分布 6、 共轭先验分布 7、 先验分布中超参数的确定 8、 贝叶斯网络统计推断 9、 参数的Bayes点估计 10、 Bayes区间估计 11、 Bayes假设检验 12、 案例:R语言实现贝叶斯网络统计分析建模 13、 模型评估与调优方法 14、 分类算法的应用 15、 R语言代码实战实操:R语言实现贝叶斯网络统计分析建模
第9个主题: 分而治之的算法模型-决策树(深入剖析决策树算法原理及其实际应用。)(90分钟) 1、 决策树 2、 决策树构成要素 3、 决策树算法原理 4、 决策树法的决策过程 5、 决策树算法 6、 R语言实现决策树分析 7、 随机森林 8、 案例:R语言决策树分析与预测
第10个主题: 人工智能的底层模型-神经网络(介绍神经网络的基本原理及其应用)(90分钟) 1、 神经网络介绍 2、 神经网络概念 3、 神经网络发展历史 4、 神经网络的别名 5、 神经网络研究的主要内容 6、 神经网络基本构成 7、 神经网络模拟人的智能行为的四个方面 8、 神经网络的特点 9、 学习能力 10、 适应性问题 11、 神经网络基本网络模型 12、 单层网络 13、 多层网络 14、 循环网络 15、 基本网络结构特点 16、 典型训练算法 17、 运行方式 18、 典型问题解决方法 19、 感知机 20、 线性神经网络 21、 BP神经网络 22、 RBF网络 23、 竞争网络 24、 反馈神经网络 25、 随机神经网络 26、 遗传算法 27、 PSO与神经网络优化 28、 卷积神经网络(CNN) 29、 循环神经网络(RNN) 30、 案例研讨:手写体数字图片识别
第11个主题: 人工智能(AI)概述(介绍人工智能(AI)的基础知识、概念、发展历史以及将来趋势)(90分钟) 1、 案例研讨:AlphaGo的基本原理,李世石与AlphaGo的对局分析 2、 人工智能(AI)时代 3、 人工智能应用 a) 计算机视觉(Computer Vision) b) 自动驾驶(Autonomous Vehicle) c) 推荐系统(Recommendation System) d) 自然语言处理(Natural Language Processing) 4、 什么是人工智能(Artificial Intelligence) 5、 人工智能历史和算法概述 6、 人工智能图灵测试 7、 成功人工智能经典案例 8、 案例研讨:手写体数字图片识别 9、 案例研讨:用CNN进行图片物体识别 10、 案例研讨:宝马BMW智能汽车装配生产线 11、 案例研讨:可口可乐Coca-cola全自动化生产线 |