课程大纲
第一部分 机器学习
基于Python的监督学习实现
实现降维
相关性分析
主成分分析
使用Python进行分类
监督学习
决策树
朴素贝叶斯分类器
支持向量机
近邻分类器
情绪分析
图像识别
逻辑回归
无监督学习—聚类
K均值聚类
DBSCAN聚类
深度学习和神经网络
反向传播
TensorFlow
递归神经网络
时间序列
变化的分类
包含趋势的序列分析
包含周期性的序列数据分析
从时间序列中去除周期性
平稳时间序列
ARMA模型
第二部分 NLP 自然语言处理
NLP基本算法和模型一
Metropolis-Hastings算法
共轭先验分布
Laplace平滑
基本算法与模型二
主题模型LDA
案例分析
LDA开源包的使用和过程分析
文本分析
网络爬虫的原理和代码实现
基本算法和模型三
Gibbs采样详解
TF-IDF算法
隐马尔科夫模型的应用优劣比较
自然语言推测Natural Language Inference (NLI)
上下文词嵌入模型Embedding from Language Model (ELMo)
案例分析
HMM用于中文分词
文件数据格式UFT-8、Unicode
发现新词和分词效果分析
基本算法和模型四
词性标注(POS)
支持向量机SVM
线性回归LR
命名实体识别NER(Named Entity Recognition)
案例分析
高斯混合模型HMM
GMM-HMM用于数据特征提取
Keras开工具的使用
基本算法和模型五
词性标注算法
近义词与相似词算法
字符级嵌入算法
FastText算法
语境相似度算法
案例分析
基本算法和模型六
循环神经网络RNN
长短记忆模型LSTM
门循环单元GRU
注意力机制
BERT模型
对抗网络
案例分析
IMDB评论分析
文本分类
机器翻译与机器备注
基本算法和模型七
动态记忆网络DMN
语义角色标注SRL(Semantic Role Labeling)
词袋模型CBOW(continuous bag-of-words)
卷积神经网络隐马尔科夫模型CNN-HMM
卷积神经网络CNN
案例分析
采样总结
问答系统
对话系统(Dialogue Systems)