4006-998-758
3000+课程任你选择
用Python进行机器学习开发
研发学院 python 数据分析 数据处理
顾翔

1997年毕业于北京工业大学,毕业后即从事软件测试工作,曾经在炎黄新星网络科技有限公司、中兴通讯股份有限公司、意法半导体(中国)有限公司和爱立信通信(中国)有限公司担任软件测试工程师,软件测试经理等职务,积累了丰富的软件研发测试的理论和实践经验。现专职从事软件开发与测试、大数据以及云计算相关的培训工作。


查看老师详情
课程内容

1、数据分析


1.1基本库

Numpy

Pandas

Matplotlib

Scipy

1.2数据分析

数据加载

cvs文件

Excel文件

数据库

数据清洗和准备

数据概览和类型转换

处理丢失数据

处理重复数据

数据转换

数据替换

数据离散化

数据拆分

过滤异常值

字符串处理

数据规整

层次化索引

合并数据集

重塑和轴向旋转

可视化

折线

柱状图

直方图和密度图

散点图

分组聚合

分组

聚合

基本聚合

桶分析

 

2 、机器学习算法


原理

线性模型(Linear)

线性模型原理

线性回归(LinearRegression)

StatsModels的线性回归

逻辑回归算法(Logistical Regression)

岭回归算法(Ridge Regression)

套索回归算法(Lasso Regression)

弹性网络(Elastic Net)

K邻近算法(KNeighbors)

K邻近算法原理

K邻近分类算法(KNeighborsClassifier)

K邻近回归算法(KNeighborsRegressor)

朴素贝叶斯

朴素贝叶斯原理(NB)

贝努利贝叶斯(BernoulliNB)

高斯贝叶斯(GaussianNB)

多项式贝叶斯(MultinomialNB)

支持向量机(SVM)

支持向量机原理

支持向量机分类算法(SVC)

支持向量机线性分类算法(LinearSVC)

支持向量机回归算法(SVR)

支持向量机线性回归算法(LinearSVR)

决策树(DecisionTree)

决策树原理

决策树分类算法(DecisionTreeClassifier)

决策树回归算法(DecisionTreeRegressor)

集成学习

集成学习原理

随机森林算法(RandomForest)

随机森林分类算法(RandomForestClassifier)

随机森林回归算法(RandomForestRegressor)

AdaBost(Adaptive Boosting)

装袋算法(Bagging)

投票分类(Voting Classifier)

堆垛分类(Stacking Classifier)

聚类

聚类原理

K均值聚类(k-means)

凝聚聚类(agglomerative)

DBSCAN

降维

降维原理

主生成分析(PCA)

非负矩阵分解(NMF)

线性判别分析(LDA)

神经网络(MLP)

神经网络原理

神经网络分类算法(MLPClassifier)

神经网络分类算法(MLPRegressor)

 

3、 数据处理和优化


数据处理

数据表达与特征工程

模型评估

管道模型


返回上一级