课程背景
人工智能(Artificial Intelligence),英文缩写为AI。它是研究和开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。是对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但能像人那样思考、也可能超过人的智能。
人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大。
人工智能是一门极富挑战性的科学,从事这项工作的人必须懂得计算机知识、心理学和哲学。人工智能是包括十分广泛的科学,它由不同的领域组成,如机器学习、计算机视觉、神经网络等等,总的说来,人工智能研究的一个主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作。
随着人工智能时代的快速到来,以及大数据在生产生活中迅速应用,数据分析、数据建模、数据挖掘、机器学习、神经网络、深度学习、人工智能等重要性越发突出,本课程是针对人工智能时代的特点,尹老师总结多年人工智能工作经验,而精心设计的课程,课程内容涵盖了数据处理、统计分析、数据挖掘、机器学习、神经网络、深度学习、人工智能等内容,以及人工智能的应用范围、发展前景剖析。
课程目标
1、 通过培训使学员深入理解Spark的大数据实现技术原理;
2、 PySpark基础与进阶:Spark基础、RDD、DataSet操作、SQL操作,Spark分布式部署与任务调度、机器学习流程与Pipeline、图计算介绍与图计算性能。
3、 通过培训使学员深入理解并能运行PySpark 的Core、Streaming、SQL、Mllib、GraphX等子项目;
4、 通过培训使学员具备PySpark内存计算框架的开发编程能力;
5、 通过培训使学员学会PySpark程序开发,处理业务数据,掌握数据处理,独立完成数据分析,变量处理,数据等,独立完成数据建模,模型拟合及策略验证分析;
授课对象
1、 对深度学习算法原理和应用感兴趣,具有一定编程(Python)和数学基础(线性代数、微积分、概率论)的技术人员。
2、 即将投身于人工智能、机器学习、数据挖掘领域的企业或者个人;
3、 系统架构师、系统分析师、高级程序员、资深开发人员;
4、 电信行业、政府机关、金融保险、移动互联网、能源行业等人工智能相关人员;
5、 高校、科研院所统计分析研究员,涉及到人工智能的人员;
授课方式
以课堂讲解、演示、案例分析为主,辅以互动研讨、现场答疑、学以致用。
课程大纲
时间 | 内容 |
第一天 | 第1个主题: 人工智能(AI)概述(介绍人工智能(AI)的基础知识、概念、发展历史以及将来趋势)(60分钟) 1、 人工智能(AI)时代 2、 人工智能应用 a) 计算机视觉(Computer Vision) b) 自动驾驶(Autonomous Vehicle) c) 推荐系统(Recommendation System) d) 自然语言处理(Natural Language Processing) e) 个性化医疗(Personalized Medicine) f) 机器人(Robot) g) 无人直升机 h) 助理还是杀手?(Assistant or Killer?) i) 金融(Finance)智慧金融 3、 什么是人工智能(Artificial Intelligence) 4、 人工智能历史和算法概述 5、 人工智能诞生标志:达特茅斯会议 6、 致力于使用概率方法AI 7、 符号主义学派的创始人 8、 人工智能简史 9、 成功人工智能经典案例 10、 案例研讨:手写体数字图片识别 11、 案例研讨:用CNN进行图片物体识别 12、 案例研讨:宝马BMW智能汽车装配生产线 13、 案例研讨:可口可乐Coca-cola全自动化生产线
第2个主题: 自动化深度学习算法模型(介绍自动化深度学习的基础知识、概念、发展历史以及将来趋势)(60分钟) 1、 自动化深度学习AutoDL介绍 2、 自动化深度学习概念 3、 自动化深度学习特征 4、 自动化深度学习基本思想 5、 浅层学习与自动化深度学习 6、 自动化深度学习与神经网络 7、 自动化深度学习的训练过程 8、 自动化深度学习的常用模型 9、 自动化深度学习的应用 10、 自动化深度学习算法模型应用领域 11、 自动化深度学习算法模型优劣势剖析 12、 AutoDL的设计架构 13、 AutoDL在增强学习中的使用 14、 AutoDL正则化是防止过拟合的关键 15、 AutoDL深度神经网络设计的应用 16、 AutoDL自动GAN架构
第3个主题: 数据挖掘及决策,分析应用,策略验证(介绍数据挖掘及决策,分析应用,策略验证)(30分钟) 1、 什么是数据挖掘 2、 数据挖掘的应用领域 a) 模式识别 b) 文本挖掘 c) 图片挖掘 d) 视频挖掘 3、 人工智能、机器学习、深度学习 4、 数据可视化挖掘 5、 数据挖掘模型 6、 数据挖掘模型评估 7、 数据挖掘目标 8、 数据挖掘数据质量 9、 数据挖掘的9大定律 10、 数据挖掘发展趋势 11、 数据挖掘及决策,分析应用,策略验证 12、 商务智能
第4个主题: 大数据决策分析(深入理解大数据可视化的重要意义及技巧)(30分钟) 1、 决策分析 2、 商务智能 3、 什么决策? 4、 商业信息 5、 知识和洞察力 6、 决策的原则 7、 决策的依据 8、 科学化决策 9、 决策支持体系 10、 传统商务智能的五大关键技术 11、 大数据商务智能 12、 报告撰写 13、 报表编制 14、 决策分析算法剖析 15、 大数据可视化技术介绍 16、 大数据可视化 17、 大数据可视化技巧 18、 大数据化可视化工具
第5个主题: 机器学习应用案例剖析(介绍机器学习概念为深度学习奠定基础)(120分钟) 1、 机器学习能学习什么? 2、 机器学习是如何学习的? 3、 从哪里学习? 4、 学习的目的是什么? 5、 学习的方法是什么? 6、 监督式学习 7、 非监督式学习 8、 半监督式学习 9、 强化学习 10、 训练集、测试集与验证集 11、 模型评分 12、 损失函数 a) 最小二乘法 b) 梯度下降 c) 极大似然 13、 激活函数 a) S型曲线 b) 反正切 c) relu d) 阶跃 14、 二元分类器 15、 多元分类器 a) Softmax 16、 求导 17、 求偏导 18、 链式求导 19、 机器学习的过程 a) 收集数据 b) 预处理数据 c) 探知数据 d) 分析数据 e) 选择模型 f) 训练模型 g) 评估模型 h) 发布模型
第6个主题: 机器学习算法剖析(典型的大数据挖掘机器学习算法剖析)(120分钟) 1、 监督式学习 2、 非监督式学习 3、 半监督式学习 4、 聚类算法解析 a) K-means Clustering b) Bisecting k-means c) Gaussian Mixture Model (GMM) d) Canopy Clustering e) Fuzzy K-means f) Expectation Maximization g) Mean Shift Clustering h) Hierarchical Clustering i) Dirichlet Process Clustering j) Latent Dirichlet Allocation(LDA) k) Spectral Clustering 5、 分类算法解析 a) Linear regression b) Generalized linear regression c) Logistic regression d) Decision tree e) Random forest f) Gradient-boosted tree g) Multilayer perceptron classifier h) One-vs-Rest classifier (a.k.a. One-vs-All) i) Naive Bayes j) Survival regression k) Isotonic regression 6、 协同过滤算法解析 7、 训练数据集与评分 8、 关联规则算法 9、 神经网络 10、 深度学习
|
时间 | 内容 |
第二天 | 第7个主题: 神经网络算法模型概述(介绍人工神经网络的基础知识、概念、发展历史以及将来趋势)(90分钟) 1、 神经网络介绍 2、 神经网络概念 3、 神经网络发展历史 4、 神经网络的别名 5、 神经网络研究的主要内容 6、 神经网络基本构成 7、 神经网络模拟人的智能行为的四个方面 8、 神经网络的特点 9、 学习能力 10、 适应性问题 11、 神经网络基本网络模型 12、 单层网络 13、 多层网络 14、 循环网络 15、 基本网络结构特点 16、 典型训练算法 17、 运行方式 18、 典型问题解决方法 19、 感知机 20、 线性神经网络 21、 BP神经网络 22、 RBF网络 23、 竞争网络 24、 反馈神经网络 25、 随机神经网络 26、 遗传算法 27、 PSO与神经网络优化 28、 神经网络算法模型应用领域 29、 神经网络算法模型优缺剖析
第8个主题: 基本DNN模型(介绍DNN的基础知识、概念、发展历史以及将来趋势)(120分钟) 1、 自动化深度学习概要 2、 什么是自动化深度学习&与机器学习的异同 3、 多层感知器模型Multi-Layer Perceptron–MLP 4、 神经元权重和激活 NeuronsWeight Activation 5、 神经元网络Neuron Networks 6、 训练网络Training Networks 7、 Back-propagation 算法和计算图 8、 多种自适应学习率算法 Adaptive Learning Rate 9、 用 Keras 搭建 MLP 10、 载入数据 11、 定义-编译-训练-测试模型 12、 案例实践与练习:手写体数字图片识别
第9个主题: 卷积神经网络CNN(介绍总面积神经网络CNN的基础知识、概念、发展历史以及将来趋势)(120分钟) 1、 卷积神经网络 Convolutional Neural Network 2、 CNN 原理和构造: 3、 核 Filter 和卷积运算 Convolutional Layer 4、 特征图 Feature Maps 5、 池化层 Pooling 6、 全连接层 Full Connected Layer 7、 Dropout 和 Batch Normalization 8、 CNN 最佳实践 9、 CNN 实践 10、 项目:用 CNN 进行手写体识别 11、 练习:在 CNN 图像识别中通过 Image Augmentation 技术提升模型性能 12、 项目:用 CNN 进行图片物体识别 13、 项目:用 CNN电影评论情绪预测
第10个主题: 评估、调参和优化模型(介绍人工智能(AI)模型的评估、调参和优化)(60分钟) 1、 自动化深度学习模型的性能评估 2、 切分数据集合 Data Splitting 3、 手工 k-fold cross validation 4、 通用深度学习工具集Keras + Scikit-Learn 5、 用 cross-validation 评估模型 6、 用 grid-search 微调超参数 7、 序列化保存模型 8、 通过 check point 机制获取最佳模型 9、 通过绘制模型历史理解训练行为 10、 通过 dropout regularization 降低模型过拟合 11、 选取不同的 Learning Rate Schedule 提升模型性能 12、 案例研讨: 13、 实践练习:用 MLP 进行多元分类 – 植物品种分类 14、 (可选)实践练习:用 MLP 进行二元分类 – 声呐探测物体信号分析 15、 (可选)实践练习:用 MLP 进行回归 – Boston 房屋价格预测
第11个主题: 循环神经网络RNN(介绍循环神经网络Recurrent Neural Networks的基础知识、概念、发展历史以及将来趋势)(30分钟) 1、 循环神经网络 Recurrent Neural Networks 2、 RNN 原理:基本 RNN 3、 处理序列(Sequence)数据的神经网络 4、 循环神经网 RNN 架构 5、 RNN训练:如何在训练中获得稳定的梯度下降 6、 RNN 网络演化历史:RNN,LSTM,GRU 结构比较和分析
第12个主题: RNN 实践:RNN 回归(介绍RNN回归的基础知识、概念、发展历史以及将来趋势)(30分钟) 1、 用 MLP 进行时间序列预测 2、 用长短记忆网络(Long-Short Term Memory, LSTM)进行时间序列预测 3、 用LSTM进行回归 4、 用LSTM 序列窗口(Window method)进行回归 5、 用 LSTM 时间步长(Time Step)进行回归 6、 用 LSTM记忆(Memory)进行回归&Stacked LSTM 7、 RNN 进行文本生成–sequence 8、 用 LSTM 生成文本序列 9、 深度 LSTM 生成文本 10、 用 RNN 进行文本生成 11、 用LSTM进行 one-char生成 12、 用LSTM feature-window进行one-char生成 13、 用LSTM time-step进行 one-char生成 14、 用 LSTM 批内样本间保持状态进行 one-char 生成 15、 有状态 LSTM进行 one-char 生成 16、 变长输入 LSTM 17、 讨论:如何进一步提高模型 performance 18、 RNN 实践:RNN 分类 19、 项目:对电影评论进行序列分类 Sequence Classification 20、 项目:使用 dropout LSTM 21、 项目:结合使用 CNN 和 RNN 进行序列分类
第13个主题: 更多 RNN 模型(介绍其它RNN模型)(30分钟) 1、 image captioning 图像字幕 2、 machine translation 机器翻译 3、 dialogue generation 对话生成 4、 RNN 实践与应用: 5、 自动聊天机器人
第14个主题: 深度学习技术与多媒体信息处理的结合应用(分享深度学习技术与多媒体信息处理的结合应用)(30分钟) 1、 机器学习对视频认知与理解 2、 视频结构化分析 3、 视频的处理与表示 4、 基于单帧的识别方法 5、 基于CNN扩展网络的识别方法 6、 双路CNN的识别方法 7、 基于LSTM的识别方法 8、 3维卷积核(3D CNN)法 9、 视频目标检测与跟踪 10、 人物识别 11、 动作识别 12、 情感语义分析 13、 深度学习相关框架在企业研发、设计与实现方面的经验分享 14、 基于深度学习等技术面向用户的研发经验分享 15、 多媒体数据处理经验分享 |