4006-998-758
3000+课程任你选择
大数据相关技术
研发学院 大数据
徐葳

丰富的IT方面从业经验,曾任职猎豹移动大数据技术专家、中科院大数据研究院大数据技术专家,对大数据生态体系有深入理解。曾主导开发了海量日志数据采集系统、OLAP数据分析平台、数据仓库、PB级日志检索系统、数据中台等。受邀成为郑州工业应用学院特聘大数据讲师。


查看老师详情
课程内容


课程大纲


培训天数

课程模块

课程内容

第一天

(上午)

大数据系统介绍

1 大数据平台核心技术总览

2 大数据典型架构案例分析(离线数据仓库架构、实时数据仓库架构、批流一体化数仓架构、湖仓一体架构等)

大数据的基石-Hadoop

1 快速了解Hadoop

2 HDFS的核心原理及架构分析

3【实操】 HDFS的常用shell命令

4 MapReduce的核心原理及案例分析

5 YARN的核心原理及架构分析

第一天

(下午)

海量数据采集存储相关工具

(离线+实时)

1 Flume核心原理及架构分析

2 Flume的三大核心组件详解

3 【实操】Flume采集文件内容上传至HDFS

4 Kafka核心原理及架构分析

5 Kafka中的生产者和消费者详解

6 【实操】Flume深度集成Kafka架构

7 Flink CDC(新一代数据库实时数据采集工具)核心原理及架构分析

8 【实操】基于Flink CDC实时采集MySQL

第二天

(上午)

海量数据分析工具

(离线+实时)

1 Hive的核心原理及架构分析

2 【实操】Hive中数据库的操作

3 【实操】Hive中表的原理及使用((内部表、外部表、分区表、桶表)

4 【案例】:基于Hive的典型离线数据仓库架构分析

5 Doris的核心原理及架构分析

6【实操】Doris中数据库和表的使用

7【实操】Doris中常见SQL的使用

8 【案例】基于Doris的典型实时数据仓库架构分析

第二天

(下午)

海量数据计算工具

(离线+实时)

1 Spark核心原理及架构剖析

2【实操】基于Spark的典型离线计算案例

3 【实操】Spark核心Transformation算子分析及实战

4 【实操】Spark核心Action算子分析及实战

5 【案例】基于Spark的典型数据计算分析项目架构设计

6 Flink的核心原理及架构分析

7 【实操】基于Flink DataStream API的实时计算案例

8 【实操】Flink SQL在实时计算中的应用

9 【案例】基于Flink的实时数据计算项目架构设计

实时数据计算分析平台的构建

1 典型实时数据计算分析平台(实时数仓)的整体架构设计

2 核心技术组件技术选型

3 构建时的注意事项


返回上一级