课程背景
需求背景及培训目的:目前中心已有多个项目需要使用大数据及AI技术解决业务需求,但是在技术能力上还缺少落地实施的经验,特别是实时处理技术。因此需要通过外部培训加强大家在大数据及AI技术落地实战方面的能力,提升解决问题的能力。
课程需要
1. 结合编码实例讲解 Flink 实时流处理的概念、架构及用法,特别是在编码实现时需要掌握的类和方法,以及常用的 Connectors。
2. Flink 如何选择合适的执行环境,如何配置合适的执行参数,如何确保环境的稳定运行,如何避免数据丢失及灾难恢复。
3. 结合实例讲解 Flink 如何和 AI 技术相结合,解决数据流中的实时分析问题。
4. 结合一个完整的 Flink 项目,讲解项目落地需要注意的各种事项。
课程简介
Apache Flink是一个开源的针对批量数据和流数据的处理引擎,已经发展为ASF的顶级项目之一。Flink 的核心是在数据流上提供了数据分发、通信、具备容错的分布式计算。同时,Flink 在流处理引擎上构建了批处理引擎,原生支持了迭代计算、内存管理和程序优化。
随着大数据时代的快速到来,以及大数据在生产生活中迅速应用,数据分析、数据建模、数据挖掘、人工智能等重要性越发突出,本课程是针对大数据时代的特点,尹老师总结多年产品经理的经验,结合大数据与人工智能特点,本课程重点内容包括Apache Flink的诞生背景、运行原理、Apache Flink API的使用、Apache Flink流式处理的相关人工智能算法以及Apache Flink的企业级使用最佳实践。同学通过此次课程可以开发Apache Flink程序和AI程序。
课程目标
1、 结合编码实例讲解 Flink 实时流处理的概念、架构及用法,特别是在编码实现时需要掌握的类和方法,以及常用的 Connectors。
2、 Flink 如何选择合适的执行环境,如何配置合适的执行参数,如何确保环境的稳定运行,如何避免数据丢失及灾难恢复。
3、 结合实例讲解 Flink 如何和 AI 技术相结合,解决数据流中的实时分析问题。
4、 结合一个完整的 Flink 项目,讲解项目落地需要注意的各种事项。
5、 本课程注重基础,重点介绍Apache Flink的运行原理;
6、 为了促进学员的对Apache Flink的理解,结合丰富的实操案例进行讲解;
7、 课程安排注重实操,让学员通过动手实操加深对Apache Flink的理解;
8、 课程包含Apache Flink的经典案例,让学员掌握Apache Flink特征、应用场景和设计动机。
课程对象
1、本课程适合需要用到大数据及AI技术的项目组成员、大数据实验室成员;
2、本课程适合于流式编程的开发人员,、数据治理成员、对大数据及AI技术感兴趣的中高级技术人员;
3、本课程适合于大数据开发项目的团队及人员;
4、对Apache Flink感兴趣的人士;
课程方式
以课堂讲解、演示、案例分析为主,辅以互动研讨、现场答疑、学以致用。
课程大纲
时间 | 内容 | 备注 |
第一天 | 第1个主题: Apache Flink实时流处理架构及用法(Apache Flink实时流处理架构及用法)(120分钟) 1、 Apache Flink实时流处理架构及用法 2、 Flink ML,Flink的机器学习库 3、 Gelly,Flink的图计算库 4、 Apache Flink历史与趋势剖析 5、 Apache Flink特性 6、 编码实现时需要掌握的类和方法,以及常用的 Connectors 7、 实战案例:实例讲解 Flink 实时流处理的概念、架构及用法
第2个主题: Apache Flink两种数据集(Apache Flink两种数据集介绍)(120分钟) 1、 无界数据集 2、 有界数据集 3、 Data Types & Serialization 4、 Data Sources 5、 Data Sinks 6、 Iterations 7、 Fault Tolerance 8、 Debugging 9、 Apache Flink编程案例实战
第3个主题: Apache Flink流计算模型(介绍Apache Flink流计算模型)(120分钟) 1、 Flink 实时流处理的概念 2、 Apache Flink流计算模型算法剖析 3、 DataStream Transformations 4、 Physical partitioning 5、 Task chaining and resource groups 6、 Windows 7、 Window Assigners 8、 Tumbling Windows 9、 Sliding Windows 10、 Session Windows 11、 Global Windows 12、 Window Functions 13、 Triggers 14、 实战案例:Apache Flink流计算实践案例 | |
第二天 | 第4个主题: Flink如何实现高效稳定运行(Apache Flink如何实现高效稳定运行)(120分钟) 1、 Flink如何选择合适的执行环境 2、 Flink如何配置合适的执行参数 3、 Flink如何确保环境的稳定运行 4、 Flink如何避免数据丢失及灾难恢复 5、 Flink集群部署 6、 最佳实践案例:企业最佳实践案例剖析
第5个主题: Apache Flink API实战(Apache FlinkAPI实战)(120分钟) 1、 Apache Flink API说明 2、 DataSet API 3、 DataStream API 4、 Table API 5、 Apache Flink API最佳实践 6、 Apache Flink API开发实战 7、 最佳实践案例:月结算费用实践案例
第6个主题: Flink与AI 技术相结合解决数据流中的实时分析问题(Flink 如何和 AI 技术相结合,解决数据流中的实时分析问题)(120分钟) 1、 Flink 如何和 AI 技术相结合,解决数据流中的实时分析问题 2、 Flink ML,Flink的机器学习库 3、 Gelly,Flink的图计算库 4、 StreamGraph 5、 JobGraph 6、 ExecutionGraph 7、 Flink与AI最佳实践 8、 Flink与AI开发实战 9、 完整的 Flink 项目落地需要注意的各种事项 10、 最佳案例:Flink流式计算与AI结合解决实时分析实践案例分享 |