课程大纲
培训天数 | 课程模块 | 课程内容 |
第一天 (上午) | 大数据系统介绍 | 1 大数据平台核心技术总览 2 大数据典型架构案例分析(离线数据仓库架构、实时数据仓库架构、批流一体化数仓架构、湖仓一体架构等) |
大数据的基石-Hadoop | 1 快速了解Hadoop 2 HDFS的核心原理及架构分析 3【实操】 HDFS的常用shell命令 4 MapReduce的核心原理及案例分析 5 YARN的核心原理及架构分析 | |
第一天 (下午) | 海量数据采集存储相关工具 (离线+实时) | 1 Flume核心原理及架构分析 2 Flume的三大核心组件详解 3 【实操】Flume采集文件内容上传至HDFS 4 Kafka核心原理及架构分析 5 Kafka中的生产者和消费者详解 6 【实操】Flume深度集成Kafka架构 7 Flink CDC(新一代数据库实时数据采集工具)核心原理及架构分析 8 【实操】基于Flink CDC实时采集MySQL |
第二天 (上午) | 海量数据分析工具 (离线+实时) | 1 Hive的核心原理及架构分析 2 【实操】Hive中数据库的操作 3 【实操】Hive中表的原理及使用((内部表、外部表、分区表、桶表) 4 【案例】:基于Hive的典型离线数据仓库架构分析 5 Doris的核心原理及架构分析 6【实操】Doris中数据库和表的使用 7【实操】Doris中常见SQL的使用 8 【案例】基于Doris的典型实时数据仓库架构分析 |
第二天 (下午) | 海量数据计算工具 (离线+实时) | 1 Spark核心原理及架构剖析 2【实操】基于Spark的典型离线计算案例 3 【实操】Spark核心Transformation算子分析及实战 4 【实操】Spark核心Action算子分析及实战 5 【案例】基于Spark的典型数据计算分析项目架构设计 6 Flink的核心原理及架构分析 7 【实操】基于Flink DataStream API的实时计算案例 8 【实操】Flink SQL在实时计算中的应用 9 【案例】基于Flink的实时数据计算项目架构设计 |
实时数据计算分析平台的构建 | 1 典型实时数据计算分析平台(实时数仓)的整体架构设计 2 核心技术组件技术选型 3 构建时的注意事项 |