R语言,编程

R语言实战

研发学院编程 R语言

尹立庆

多年从事容器技术、云计算、物联网研发工作经验。北航移动云计算硕士。Cloudera大数据认证（图1），项目管理师（PMP）认证（图2），主要研究方向包括容器技术、云计算、物联网、项目管理等；曾就职于阿里等互联网企业，IBM、华为等知名大型企业，现任某大型知名互联网企业首席架构，负责容器技术、云计算、物联网、PaaS平台研发工作。

IT从业近二十年，秉承理论与实践相结合，在学习中实践，在实践中学习，积累了丰富的理论与实践经验，并且乐于将自己的经验分享。尹老师具有敏锐的目光与头脑，发现并集成整合社会资源，为企业节省资源并创造价值，达到为合作伙伴创收的目的。曾为多家国内知名企业提供培训与咨询，包含阿里集团、华为、中国移动、中国电信、中国联通、当当网、中石油、中石化、中国电网、中国银行、中国工商银行、浦发银行、阿尔卡特朗讯、中航国际等。拥有云计算、物联网、大流量、高并发、分布式的大型网站架构和设计经验。曾主导过多个云计算、物联网、私有云、公有云建设项目，早些年也主导过ERP、CMS等软件项目，积累了丰富的实践经验，这些项目中包含多个数百万、上千万的大型项目。项目经历：呼叫中心人工智能客服研发项目、贵州省政府云呼叫中心建设项目、广东发展银行电营、运维大数据分析项目、中石油工程设计西南分公司云计算项目评审委员、中石油大数据挖掘项目，电商库存预测大数据分析项目、大型ERP、电子商务、CRM、电子政务等多个项目。

查看老师详情

课程内容

课程目标

R语言入门基础；

R语言进行描述性分析；

市场调研与数据预处理技术；

透过现象看本质：回归分析；

最简单的机器学习算法 -K最近邻；

数学与科学的反映-贝叶斯网络；

分而治之的算法模型-决策树；

人工智能的底层模型-神经网络。

课程对象

对R语言感兴趣的数据分析人士；

对数据分析、数据挖掘算法等感兴趣的人士；

对数据可视化分析、数据可视化展现等感兴趣的人士；

适合于经常需要汇报工作的管理者；

本课程适合于想通过数据化决策制定企业战略的决策者；

课程方式

以课堂讲解、演示、案例分析为主，辅以互动研讨、现场答疑、学以致用。

课程大纲

时间	内容	备注
第一天	第1个主题： R语言基础知识与语法（课程目标：掌握R语言的基本知识与基础语法、用R编写函数）（120分钟） 1、 R语言历史与趋势剖析 2、安装R语言 3、 RStudio使用 4、工作空间的设置 5、 R程序包的载入与使用 6、 R资源网上查找方法介绍第2个主题： R语言入门基础（介绍R语言基础语法）（120分钟） 1、 R语言的数据类型 2、 R语言的数据结构（向量、矩阵、数组、列表与数据框） 3、循环语句 4、条件语句 5、遍历 6、常用函数 7、常用算法 8、定性变量 9、离散变量 10、连续变量 11、多元变量 12、对向量、矩阵和列表进行运算 13、提取和插入元素 14、日期和时间数据的操作处理 15、编写自定义函数解决复杂问题 16、编程技巧 17、编程案例介绍第3个主题： R语言的绘图（课程目标：掌握R语言绘图函数，R语言的探索性分析与数据可视化）（120分钟） 1、绘图函数 2、散点图 3、柱状图 4、直方图 5、图形增强函数 6、图形互动函数 7、高级绘图命令
第二天	第4个主题：市场调研与数据预处理技术（介绍市场调研与数据预处理技术）（90分钟） 1、市场调研 2、调研表格设计 3、调研数据录入 4、数据预处理技术 5、数据的读入和输出 6、 R语言连接RDBMS数据库介绍 7、数据库的读/写 8、 R和SQL的交互 9、数据预处理 10、日期和时间的处理 11、因子变量的操作 12、下标数据整理技术 13、字符串操作 14、数据子集的筛选 15、识别重复数据和缺失值处理 16、函数映射数据转换整理技术 17、变量的重新编码 18、 plyr、reshape2等包整理数据第5个主题： R语言进行描述性分析（掌握R语言用法和基本数据分析、数据描述统计分析）（90分钟） 1、基本数据分析（随机数的生成和统计模拟） 2、单变量数据分析与作图 3、双变量数据分析与作图（二维表分析，并列箱线图，相关系数） 4、多变量数据分析与作图（多变量相关系数矩阵） 5、离群点检测 6、案例1：汽车数据描述统计分析 7、案例2：财政收入与税收描述统计分析第6个主题：透过现象看本质：回归分析（课程目标：透过现象看本质：回归分析）（90分钟） 1、案例分享：透过现象看本质 2、一元线性回归 3、多元线性回归 4、逐步回归 5、 logistic回归 6、案例1：淘宝双十一销售额预测 7、案例2：产品销量预测第7个主题：最简单的机器学习算法-K最近邻（深入剖析最简单的机器学习算法-K最近邻）（90分钟） 1、 K近邻法(KNN)原理 2、 k最近邻算法(kNN) 3、 kNN模型的三要素 4、距离度量 5、蛮力实现(brute-force) 6、 KD树实现(KDTree) 7、球树(BallTree)实现 8、搜索k近邻 9、模型评估与调优方法 10、分类算法的应用 11、 R语言代码实战: K近邻算法R语言实现
第三天	第8个主题：数学与科学的反映-贝叶斯网络（深入剖析贝叶斯网络算法的基本原理和实现）（90分钟） 1、贝叶斯网络统计模型 2、贝叶斯网络统计分析的基本思想 3、贝叶斯网络统计模型 4、贝叶斯网络统计推断原则 5、先验分布的Bayes假设与不变先验分布 6、共轭先验分布 7、先验分布中超参数的确定 8、贝叶斯网络统计推断 9、参数的Bayes点估计 10、 Bayes区间估计 11、 Bayes假设检验 12、案例：R语言实现贝叶斯网络统计分析建模 13、模型评估与调优方法 14、分类算法的应用 15、 R语言代码实战实操：R语言实现贝叶斯网络统计分析建模第9个主题：分而治之的算法模型-决策树（深入剖析决策树算法原理及其实际应用。）（90分钟） 1、决策树 2、决策树构成要素 3、决策树算法原理 4、决策树法的决策过程 5、决策树算法 6、 R语言实现决策树分析 7、随机森林 8、案例：R语言决策树分析与预测第10个主题：人工智能的底层模型-神经网络（介绍神经网络的基本原理及其应用）（90分钟） 1、神经网络介绍 2、神经网络概念 3、神经网络发展历史 4、神经网络的别名 5、神经网络研究的主要内容 6、神经网络基本构成 7、神经网络模拟人的智能行为的四个方面 8、神经网络的特点 9、学习能力 10、适应性问题 11、神经网络基本网络模型 12、单层网络 13、多层网络 14、循环网络 15、基本网络结构特点 16、典型训练算法 17、运行方式 18、典型问题解决方法 19、感知机 20、线性神经网络 21、 BP神经网络 22、 RBF网络 23、竞争网络 24、反馈神经网络 25、随机神经网络 26、遗传算法 27、 PSO与神经网络优化 28、卷积神经网络（CNN） 29、循环神经网络（RNN） 30、案例研讨：手写体数字图片识别第11个主题：人工智能（AI）概述（介绍人工智能（AI）的基础知识、概念、发展历史以及将来趋势）（90分钟） 1、案例研讨：AlphaGo的基本原理，李世石与AlphaGo的对局分析 2、人工智能（AI）时代 3、人工智能应用 a) 计算机视觉（Computer Vision） b) 自动驾驶（Autonomous Vehicle） c) 推荐系统（Recommendation System） d) 自然语言处理（Natural Language Processing） 4、什么是人工智能（Artificial Intelligence） 5、人工智能历史和算法概述 6、人工智能图灵测试 7、成功人工智能经典案例 8、案例研讨：手写体数字图片识别 9、案例研讨：用CNN进行图片物体识别 10、案例研讨：宝马BMW智能汽车装配生产线 11、案例研讨：可口可乐Coca-cola全自动化生产线

返回上一级

课程时长

3天

课程排期

待定

我要报名我要分享

课程推荐

返回上一级