4006-998-758
3000+课程任你选择
数据分析与数据挖掘最佳实践
研发学院 企业级数据库架构 数据库方向 开课时间:2022-02-17
戴子良

微软MCDBA、MCT(微软认证讲师,数据库方向),BI专家,在数据库、数据仓库、数据挖掘等方面有很深的造诣,负责企业级数据库架构,ETL,数据仓库设计,海量数据的优化处理以及数据分析与数据挖掘等项目实施与实现。负责和参与开发的主要项目有:微软总部MSN数据挖掘项目;微软总部Microsoft Marketing数据分析项目等。对数据库及数据仓库的架构和海量数据的优化处理有丰富的项目经验和处理方法,授课中结合丰富的实际项目案例,使学员轻松掌握数据库、数据仓库、商业智能和数据挖掘等相关技术。


查看老师详情
课程内容

课程介绍


本次课程将介绍数据分析、数据校验、数据仓库、商业智能和数据挖掘等技术的基本理论和体系架构,通过大型数据分析和数据挖掘项目案例阐述ETL、数据仓库、数据挖掘项目的实施过程和方法。通过实际应用案例介绍ODS、MDM、DW、OLAP、DM、元数据管理等重要概念。详细讲解构建数据仓库和数据挖掘体系的核心方法和技术,并结合实际项目搭建数据仓库和数据挖掘环境。掌握主流数据仓库和数据挖掘厂商及相关软件产品的操作和使用。


课程特点


1、 培训过程中将以大型项目案例为背景,逐步讲解整个数据分析和数据挖掘的设计过程和实施方法
2、 课程将以深入浅出的案例让学员轻松掌握数据仓库和数据挖掘相关技术
3、 课程的重点是项目实施,将深入探讨数据仓库和数据挖掘项目的实施问题,逐一解决项目实施过程中所遇到的问题和处理技巧
4、 结合动手实验和实际项目案例,使学员充分理解数据仓库和数据挖掘架构设计和相关工具的使用


课程大纲



专题

授课内容

简述

 

专题一:

BI基础知识

内容一:数据仓库基本概念

1、数据仓库的来源及定义

2、数据仓库的应用领域

3、数据挖掘的来源及定义

4、数据挖掘的应用领域

内容二:BI的架构

1、BI体系介绍

2、数据仓库介绍

3、ETL介绍

4、多维数据库介绍

5、前端展现介绍

6、数据挖掘模型介绍

内容三:BI工具介绍

1、ETL工具---SSIS介绍

2、OLAP工具---SSAS介绍

3、报表工具---SSRS介绍

4、数据挖掘工具---SSAS中的挖掘模型

内容四、BI在行业中的应用
 
 1、现代企业BI需求概述

2、电力行业案例分析

3、生产制造行业案例研究

4、医药行业案例分析
   5、BI系统数据更新与维护

介绍数据仓库与数据挖掘基本概念,BI体系架构, BI工具介绍及其应用,针对行业提供行业解决方案和案例分析。

专题二:

数据仓库架构设计与完整流程详解

内容一、数据仓库设计

1、数据仓库设计原则与模型搭建

2、星型架构与雪花型架构

3、事实表与维度表的设计

4、逻辑设计与物理设计

5、数据仓库设计的常用方法

6、数据仓库设计技巧总结

7、数据仓库案例分析

内容二、数据校验

 1、数据校验简介

2、为什么要进行数据校验

3、数据校验的方法

4、数据校验应用

5、数据校验案例分析

内容三、ETL

1、数据集成方法

2、数据抽取

3、数据转换

4、数据加载

5、ETL调度策略

6、缓慢变化维度和时间戳的处理

7、ETL高级技巧

8、ETL案例分析

内容四:OLAP模型设计

1、OLAP的应用场合

2、OLAP模型搭建

3、统一维度模型UDM

4、确定维度、量度与事实的关系

5、使用计算成员

6、使用KPI

7、OLAP中的高级应用

内容五:前端展现分析

1、多维分析报表

2、报表设计

3、报表开发

4、报表分发和定制

5、报表权限管理

6、报表集成

介绍数据仓库设计的基本原则和数据仓库的架构设计方式,以及构建数据仓库的核心步骤,提供数据校验、ETL,OLAP,报表等整体解决方案和设计方法。

 

 

 

 

 

专题三:

数据挖掘架构设计与完整流程详解

内容一:九种数据挖掘算法

1、 九种挖掘算法应用的背景

2、 决策树算法与模型设计

3、 聚类算法与模型设计

4、 关联规则算法与模型设计

5、 贝叶斯算法与模型设计

6、 时间序列算法与模型设计

7、 其他挖掘算法与模型设计

内容二:常用挖掘模型详解

1、决策树算法详解及工具实现

2、聚类算法详解及工具实现

3、关联规则算法详解及工具实现

4、贝叶斯算法详解及工具实现

5、时间序列算法详解及工具实现

6、数据挖掘模型评估

内容三:数据挖掘的流程

1、数据清洗准备

2、数据预处理

3、选择数据挖掘模型

4、数据挖掘模型训练

5、更新算法模型

6、模型评估

7、部署与应用

内容四:DMX语言

1、DMX语法结构

2、使用DMX创建挖掘模型

3、使用DMX将挖掘结果导出

4、使用DMX进行挖掘模型参数设置

九种数据挖掘算法与模型详解,数据挖掘的设计与实施流程,数据挖掘查询语言的使用等,重点对决策树算法、关联规则算法、聚类算法等给出详细设计和处理流程。

专题四:

数据仓库与数据挖掘项目案例分析

内容一:Novartis大型数据仓库项目

1、项目介绍

2、复杂多系统多数据源的特点

3、ODS的使用

4、整体项目架构设计

5、ETL流程设计

6、MDM管理

7、缓慢变化维度的使用

8、抽取策略的制定

9、OLAP与报表的设计和使用

10、数据仓库更新技巧

内容二:MSN数据挖掘项目

1、项目介绍

2、项目中的海量数据

3、数据挖掘算法

4、数据挖掘模型构建

5、数据的预处理技术

6、对挖掘模型进行训练

7、展示数据挖掘模型结果

8、数据挖掘模型评估

内容三:AdventureWorks整体项目案例

1、案例介绍

2、ETL流程详解

3、OLAP流程详解

4、前端报表流程详解

5、数据挖掘流程详解

大型数据仓库与数据挖掘项目设计和实施,重点对项目架构设计和数据完整处理流程做重点分析和详细介绍,针对大型数据仓库项目,提供了完备的异构数据源集成方案,以及ODS、MDM、缓慢变化维度等的应用技巧,针对数据挖掘项目给出完整设计思路和数据处理技术应用。

 



返回上一级