4006-998-758
3000+课程任你选择
Python大数据可视化
研发学院 可视化 Python 大数据 开课时间:2022-01-18
丁来强

世界跨国大数据公司EMC美国研发中心(2006-2011):历任软件开发工程师、高级软件开发工程师,高级架构师,大数据技术经理。

世界顶级大数据公司Splunk(2012-2015),历任美国Splunk上海研发中心高级架构师、高级研发经理。

国内Top云平台研发中心(2016—至今):大数据技术总监。

丁老师在以上3家公司工作10余年,主要从事云计算和大数据研发等工作,长期任职大数据平台的构建相关领域的产品研发工作,在大数据处理、大数据分布式并行计算,流式计算处理系统、数据可视化领域有丰富的实战项目经验。


查看老师详情
课程内容


课程目标


帮助学员:

了解并掌握Python大数据分析可视化的挑战、问题、方法与可行的技术方案。

掌握如何使用Python 从数据获取、分析到分享、展示的闭环。

知道如何使用Python 展示较大规模数据。

如何提高数据展示的效果,知道如何提供一个具备一定交互能力的数据分享、展示系统。

知道构建展示系统的最佳实践,以便更高效的维护和扩展性功能与性能。


学员要求


不要求全部达到,具备以下大部分,对于掌握本课程内容会奠定一个良好的基础:

1. 学员使用Python超过一年,掌握基本或中级Python语法,例如列表推导式、with语句、列表切片、函数变长参数、了解常见数据结构tuple、list、set和map 等

2. 学员知道、了解或掌握一些前端开发的知识:

a. 知道HTML、CSS的运行机制、能力和限制等。例如:知道DOM等、CSS Box模型等。

b. 了解JavaScript的能力、运行机制、通讯方式、限制等。例如DOM操作、异步调用等。

c. 了解后台REST的原理、机制等。

d. 了解一些前端框架的发展和现状,例如react、boostrap、D3等

3. 学员知道知道如何使用Python进行一定的数据分析:

a. 了解数据分析的一般方法、流程和挑战。

b. 知道Python数据分析的优势、劣势以及主要工具包。

c. 编写或者阅读过Python数据分析的代码,例如:知道如何使用Pandas整理、分析杂乱数据并统计等。

d. 知道如何使用Pandas记下来时间序列数据的规整与分析。

4. 学员具备一定的编写代码的经验,包括但不限于:

a. 手工编写超过5千行Python代码

i. 或者手工编写超过8千行其他语言的代码(例如C++)

ii. 或者维护修改过超过5千行规模的Python代码的项目(并通读过其代码)

b. 编写或者阅读过一些前端HTML、JS、CSS代码。


课程大纲


培训内容

1、第一单元:Python数据可视化的方法与策略

主题:围绕Python数据可视化的问题、挑战进行一次较为完整的剖析。

具体内容:

1. 一般可视化问题、原理与方法

2. 一般可视化的策略与最佳实践

3. 数据可视化的问题、与方法

4. 大数据可视化的挑战与策略

5. Python数据可视化的特点与方法

6. Python数据可视化的挑战与策略

 

2、第二单元:Python简单数据可视化的实战

主题:针对某新闻网站,使用Python进行一次快速的抓取、清洗、分析、统计、可视化的闭环操作。

具体内容:

1. 数据抓取与规整

2. 数据分析与统计

3. 数据可视化

 

3、第三单元:Python复杂数据可视化的实战

主题:针对某网站用户数据,使用Python进行一次较为复杂的分析、可视化与分享操作。

具体内容:

- 时间序列的数据展示

- 多维度统计与展示数据

- 分享数据

 

4、第四单元:Python可视化高级议题

主题:通过某网站数据,展示如何进一步扩展数据展示的能力与效果

具体内容:

- 如何导出并分享数据。

- 大规模数据时如何展示数据。

- 如何增加交互式功能。

- 如何增加安全和限制访问的权限。

- 其他高级议题。


返回上一级