4006-998-758
3000+课程任你选择
Python大数据分析可视化高级
研发学院 Python 大数据 可视化 开课时间:2022-01-18
丁来强

世界跨国大数据公司EMC美国研发中心(2006-2011):历任软件开发工程师、高级软件开发工程师,高级架构师,大数据技术经理。

世界顶级大数据公司Splunk(2012-2015),历任美国Splunk上海研发中心高级架构师、高级研发经理。

国内Top云平台研发中心(2016—至今):大数据技术总监。

丁老师在以上3家公司工作10余年,主要从事云计算和大数据研发等工作,长期任职大数据平台的构建相关领域的产品研发工作,在大数据处理、大数据分布式并行计算,流式计算处理系统、数据可视化领域有丰富的实战项目经验。


查看老师详情
课程内容


课程大纲



1. 第一单元:相关核心语法与设计模式

主题:通过丰富实例代码,提纲挈领地介绍Python数据分析相关的核心语法与设计模式。

具体内容:

(1)  内置数据结构

(2)  切片技术

(3)  字符编码

(4)  正则表达式

(5)  推导式

(6)  迭代器

(7)  生成器

(8)  IO与网络操作

 

2. 第二单元:Python基本数据分析可视化实战

主题:提纲挈领地介绍Python数据分析的生态环境、方法,让学员了解数据分析的关键方法、时间投入点。介绍Python自身核心技术、通过一个网站的数据实例,来快速了解如何高效使用Pandas进行数据处理。

具体内容:

(1)  Python vs. R

(2)  数据分析方法

(3)  Python数据分析生态

(4)  数据清洗实战

(5)  Pandas技术概述

 

3.第三单元:Python高级数据分析可视化

主题:通过三个实例(两个大型网站的用户数据,一个市场销售数据)出发,系统全面地介绍Python核心数据分析可视化工具栈(NumPy/Pandas/SeaBorn)。在全面深入的通过一个个精炼实例来介绍Python数据分析中的核心技术点。

具体内容:

(1)  高级数据分析实战1

(2)  高级数据分析实战2

(3)  高级数据分析实战3

(4)  数据结构

(5)  基本方法

(6)  字符操作

(7)  索引与选择

(8)  多层高级索引

(9)  统计工具

(10) 清洗数据

(11) 分组

(12) 归并与拼接

(13) 重塑与Pivot

(14) 可视化

(15) 集成IO操作

(16) 多维度分析

 

4.第四单元:时间序列可视化分析

主题:通过某网站数据,使用Pandas进行基于时间序列的分析

1. 具体内容:

2. 时间序列的格式

案例分析:基于时间的数据进行统计分析

3. 高级时间格式

案例分析:时间格式的调整与转换

4. 时间块数据分析

案例分析:基于时间块的数据分析。

返回上一级