4006-998-758
3000+课程任你选择
大数据Flink及AI技术
研发学院 体系架构设计 产品经理 开课时间:2021-07-03
尹立庆

多年从事容器技术、云计算、物联网研发工作经验。北航移动云计算硕士。Cloudera大数据认证(图1),项目管理师(PMP)认证(图2),主要研究方向包括容器技术、云计算、物联网、项目管理等;曾就职于阿里等互联网企业,IBM、华为等知名大型企业,现任某大型知名互联网企业首席架构,负责容器技术、云计算、物联网、PaaS平台研发工作。

IT从业近二十年,秉承理论与实践相结合,在学习中实践,在实践中学习,积累了丰富的理论与实践经验,并且乐于将自己的经验分享。尹老师具有敏锐的目光与头脑,发现并集成整合社会资源,为企业节省资源并创造价值,达到为合作伙伴创收的目的。曾为多家国内知名企业提供培训与咨询,包含阿里集团、华为、中国移动、中国电信、中国联通、当当网、中石油、中石化、中国电网、中国银行、中国工商银行、浦发银行、阿尔卡特朗讯、中航国际等。拥有云计算、物联网、大流量、高并发、分布式的大型网站架构和设计经验。曾主导过多个云计算、物联网、私有云、公有云建设项目,早些年也主导过ERP、CMS等软件项目,积累了丰富的实践经验,这些项目中包含多个数百万、上千万的大型项目。项目经历:呼叫中心人工智能客服研发项目、贵州省政府云呼叫中心建设项目、广东发展银行电营、运维大数据分析项目、中石油工程设计西南分公司云计算项目评审委员、中石油大数据挖掘项目,电商库存预测大数据分析项目、大型ERP、电子商务、CRM、电子政务等多个项目。


查看老师详情
课程内容


课程背景


需求背景及培训目的:目前中心已有多个项目需要使用大数据及AI技术解决业务需求,但是在技术能力上还缺少落地实施的经验,特别是实时处理技术。因此需要通过外部培训加强大家在大数据及AI技术落地实战方面的能力,提升解决问题的能力。

 

课程需要


1. 结合编码实例讲解 Flink 实时流处理的概念、架构及用法,特别是在编码实现时需要掌握的类和方法,以及常用的 Connectors。

2. Flink 如何选择合适的执行环境,如何配置合适的执行参数,如何确保环境的稳定运行,如何避免数据丢失及灾难恢复。

3. 结合实例讲解 Flink 如何和 AI 技术相结合,解决数据流中的实时分析问题。

4. 结合一个完整的 Flink 项目,讲解项目落地需要注意的各种事项。


 课程简介


Apache Flink是一个开源的针对批量数据和流数据的处理引擎,已经发展为ASF的顶级项目之一。Flink 的核心是在数据流上提供了数据分发、通信、具备容错的分布式计算。同时,Flink 在流处理引擎上构建了批处理引擎,原生支持了迭代计算、内存管理和程序优化。

随着大数据时代的快速到来,以及大数据在生产生活中迅速应用,数据分析、数据建模、数据挖掘、人工智能等重要性越发突出,本课程是针对大数据时代的特点,尹老师总结多年产品经理的经验,结合大数据与人工智能特点,本课程重点内容包括Apache Flink的诞生背景、运行原理、Apache Flink API的使用、Apache Flink流式处理的相关人工智能算法以及Apache Flink的企业级使用最佳实践。同学通过此次课程可以开发Apache Flink程序和AI程序。


 课程目标

 

1、 结合编码实例讲解 Flink 实时流处理的概念、架构及用法,特别是在编码实现时需要掌握的类和方法,以及常用的 Connectors。

2、 Flink 如何选择合适的执行环境,如何配置合适的执行参数,如何确保环境的稳定运行,如何避免数据丢失及灾难恢复。

3、 结合实例讲解 Flink 如何和 AI 技术相结合,解决数据流中的实时分析问题。

4、 结合一个完整的 Flink 项目,讲解项目落地需要注意的各种事项。

5、 本课程注重基础,重点介绍Apache Flink的运行原理;

6、 为了促进学员的对Apache Flink的理解,结合丰富的实操案例进行讲解;

7、 课程安排注重实操,让学员通过动手实操加深对Apache Flink的理解;

8、 课程包含Apache Flink的经典案例,让学员掌握Apache Flink特征、应用场景和设计动机。

 

 课程对象


1、本课程适合需要用到大数据及AI技术的项目组成员、大数据实验室成员;

2、本课程适合于流式编程的开发人员,、数据治理成员、对大数据及AI技术感兴趣的中高级技术人员;

3、本课程适合于大数据开发项目的团队及人员;

4、对Apache Flink感兴趣的人士;

 

 课程方式


以课堂讲解、演示、案例分析为主,辅以互动研讨、现场答疑学以致用。


课程大纲


时间

内容

备注

第一天

第1个主题: Apache Flink实时流处理架构及用法Apache Flink实时流处理架构及用法)120分钟

1、 Apache Flink实时流处理架构及用法

2、 Flink ML,Flink的机器学习库

3、 Gelly,Flink的图计算库

4、 Apache Flink历史与趋势剖析

5、 Apache Flink特性

6、 编码实现时需要掌握的类和方法,以及常用的 Connectors

7、 实战案例:实例讲解 Flink 实时流处理的概念、架构及用法

 

第2个主题: Apache Flink两种数据集(Apache Flink两种数据集介绍120分钟

1、 无界数据集

2、 有界数据集

3、 Data Types & Serialization

4、 Data Sources

5、 Data Sinks

6、 Iterations

7、 Fault Tolerance

8、 Debugging

9、 Apache Flink编程案例实战

 

第3个主题: Apache Flink流计算模型(介绍Apache Flink流计算模型)120分钟

1、 Flink 实时流处理的概念

2、 Apache Flink流计算模型算法剖析

3、 DataStream Transformations

4、 Physical partitioning

5、 Task chaining and resource groups

6、 Windows

7、 Window Assigners

8、 Tumbling Windows

9、 Sliding Windows

10、 Session Windows

11、 Global Windows

12、 Window Functions

13、 Triggers

14、 实战案例:Apache Flink计算实践案例


第二天

第4个主题: Flink如何实现高效稳定运行(Apache Flink如何实现高效稳定运行)120分钟

1、 Flink如何选择合适的执行环境

2、 Flink如何配置合适的执行参数

3、 Flink如何确保环境的稳定运行

4、 Flink如何避免数据丢失及灾难恢复

5、 Flink集群部署

6、 最佳实践案例企业最佳实践案例剖析

 

第5个主题: Apache Flink API实战(Apache FlinkAPI实战)120分钟

1、 Apache Flink API说明

2、 DataSet API

3、 DataStream API

4、 Table API

5、 Apache Flink API最佳实践

6、 Apache Flink API开发实战

7、 最佳实践案例月结算用实践案例

 

第6个主题: Flink与AI 技术相结合解决数据流中的实时分析问题(Flink 如何和 AI 技术相结合,解决数据流中的实时分析问题)120分钟

1、 Flink 如何和 AI 技术相结合,解决数据流中的实时分析问题

2、 Flink ML,Flink的机器学习库

3、 Gelly,Flink的图计算库

4、 StreamGraph

5、 JobGraph

6、 ExecutionGraph

7、 Flink与AI最佳实践

8、 Flink与AI开发实战

9、 完整的 Flink 项目落地需要注意的各种事项

10、 最佳案例Flink流式计算与AI结合解决实时分析实践案例分享



返回上一级