4006-998-758
3000+课程任你选择
机器学习与NLP 自然语言处理和文本分析
研发学院 体系架构设计 产品经理 开课时间:2021-07-04
俞阳

毕业于上海交通大学,IT从业十五年,曾就职于微软、苏宁、平安等大型公司,秉承理论与实践相结合,在学习中实践,在实践中学习,积累了丰富的理论与实践经验,指导学生真正从实践中学到、体会到。

参与主导过大流量、高并发、分布式的大型网站架构(Java Spring Cloud、Redis集群、MySQL集群),参与架构多个私有云建设项目,大型数据仓库建设(Hadoop、Spark、Flink、Kafka、ClickHouse),人工智能平台( Tensorflow, Pytorch )。


查看老师详情
课程内容

课程大纲

第一部分 机器学习

基于Python的监督学习实现

实现降维

相关性分析

主成分分析

使用Python进行分类

监督学习

决策树

朴素贝叶斯分类器

支持向量机

近邻分类器

情绪分析

图像识别

逻辑回归

无监督学习—聚类  

K均值聚类

DBSCAN聚类

深度学习和神经网络

反向传播 

TensorFlow 

递归神经网络

时间序列

变化的分类

包含趋势的序列分析

包含周期性的序列数据分析

从时间序列中去除周期性

平稳时间序列

ARMA模型

第二部分  NLP 自然语言处理

NLP基本算法和模型一

Metropolis-Hastings算法

共轭先验分布

Laplace平滑

基本算法与模型二

主题模型LDA

案例分析

LDA开源包的使用和过程分析

文本分析

网络爬虫的原理和代码实现

基本算法和模型三

Gibbs采样详解

TF-IDF算法

隐马尔科夫模型的应用优劣比较

自然语言推测Natural Language Inference (NLI)

上下文词嵌入模型Embedding from Language Model (ELMo)

案例分析

HMM用于中文分词

文件数据格式UFT-8、Unicode

发现新词和分词效果分析

基本算法和模型四

词性标注(POS)

支持向量机SVM

线性回归LR

命名实体识别NER(Named Entity Recognition)

案例分析

高斯混合模型HMM

GMM-HMM用于数据特征提取

Keras开工具的使用

基本算法和模型五

词性标注算法

近义词与相似词算法

字符级嵌入算法

FastText算法

语境相似度算法

案例分析

基本算法和模型六

循环神经网络RNN

长短记忆模型LSTM

门循环单元GRU

注意力机制

BERT模型

对抗网络

案例分析

IMDB评论分析

文本分类

机器翻译与机器备注

基本算法和模型七

动态记忆网络DMN

语义角色标注SRL(Semantic Role Labeling)

词袋模型CBOW(continuous bag-of-words)

卷积神经网络隐马尔科夫模型CNN-HMM

卷积神经网络CNN

案例分析

采样总结

问答系统

对话系统(Dialogue Systems)

 

 



返回上一级