封面
版权信息
内容简介
前言
第1章 数据仓库概论
1.1 数据仓库的概念与特点
1.2 数据仓库的演进过程
1.3 数据仓库技术
1.4 数据仓库基本架构
1.5 数据库和数据仓库的区别
1.6 学前导读
1.6.1 学习的基础要求
1.6.2 你将学到什么
1.7 本章总结
第2章 项目需求描述
2.1 前期调研
2.2 项目架构分析
2.2.1 电商数据仓库产品描述
2.2.2 系统功能结构
2.2.3 系统流程图
2.3 项目业务概述
2.3.1 采集模块业务描述
2.3.2 数据仓库需求业务描述
2.3.3 数据可视化业务描述
2.3.4 即席查询业务描述
2.3.5 数据治理业务描述
2.4 系统运行环境
2.4.1 硬件环境
2.4.2 软件环境
2.5 本章总结
第3章 项目部署的环境准备
3.1 Linux环境准备
3.1.1 VMware安装
3.1.2 CentOS安装
- APP免费
3.1.3 远程终端安装
- APP免费
3.2 Linux环境配置
- APP免费
3.2.1 网络配置
- APP免费
3.2.2 网络IP地址配置
- APP免费
3.2.3 主机名配置
- APP免费
3.2.4 防火墙配置
- APP免费
3.2.5 一般用户设置
- APP免费
3.3 Hadoop环境搭建
- APP免费
3.3.1 虚拟机环境准备
- APP免费
3.3.2 JDK安装
- APP免费
3.3.3 Hadoop安装
- APP免费
3.3.4 Hadoop分布式集群部署
- APP免费
3.4 本章总结
- APP免费
第4章 用户行为数据采集模块
- APP免费
4.1 日志生成
- APP免费
4.1.1 数据埋点
- APP免费
4.1.2 用户行为日志内容
- APP免费
4.1.3 用户行为日志格式
- APP免费
4.1.4 数据模拟
- APP免费
4.2 消息队列Kafka
- APP免费
4.2.1 ZooKeeper安装
- APP免费
4.2.2 ZooKeeper集群启动、停止脚本
- APP免费
4.2.3 Kafka安装
- APP免费
4.2.4 Kafka Eagle安装
- APP免费
4.2.5 Kafka集群启动、停止脚本
- APP免费
4.2.6 Kafka topic相关操作
- APP免费
4.3 采集日志的Flume
- APP免费
4.3.1 Flume组件
- APP免费
4.3.2 Flume安装
- APP免费
4.3.3 采集日志的Flume配置
- APP免费
4.3.4 Flume的拦截器
- APP免费
4.3.5 采集日志的Flume启动、停止脚本
- APP免费
4.4 消费日志的Flume
- APP免费
4.4.1 消费日志的Flume配置
- APP免费
4.4.2 时间戳拦截器
- APP免费
4.4.3 消费日志的Flume启动、停止脚本
- APP免费
4.4.4 数据通道测试
- APP免费
4.5 采集通道启动、停止脚本
- APP免费
4.6 本章总结
- APP免费
第5章 业务数据采集模块
- APP免费
5.1 电商业务概述
- APP免费
5.1.1 电商业务流程
- APP免费
5.1.2 电商常识
- APP免费
5.1.3 电商业务表结构
- APP免费
5.1.4 数据同步策略
- APP免费
5.1.5 数据同步工具选择
- APP免费
5.2 业务数据采集
- APP免费
5.2.1 MySQL安装
- APP免费
5.2.2 业务数据生成
- APP免费
5.2.3 业务数据模型梳理
- APP免费
5.2.4 DataX安装
- APP免费
5.2.5 Maxwell安装
- APP免费
5.2.6 全量同步
- APP免费
5.2.7 增量同步
- APP免费
5.3 本章总结
- APP免费
第6章 数据仓库搭建模块
- APP免费
6.1 数据仓库理论准备
- APP免费
6.1.1 数据建模概述
- APP免费
6.1.2 关系模型与范式理论
- APP免费
6.1.3 维度模型
- APP免费
6.1.4 维度建模理论之事实表
- APP免费
6.1.5 维度建模理论之维度表
- APP免费
6.1.6 雪花模型、星形模型与星座模型
- APP免费
6.2 数据仓库建模实践
- APP免费
6.2.1 名词概念
- APP免费
6.2.2 为什么要分层
- APP免费
6.2.3 数据仓库搭建流程
- APP免费
6.2.4 数据仓库开发规范
- APP免费
6.3 数据仓库搭建环境准备
- APP免费
6.3.1 Hive安装
- APP免费
6.3.2 Hive on Spark配置
- APP免费
6.3.3 YARN容量调度器并发度问题
- APP免费
6.3.4 数据仓库开发环境配置
- APP免费
6.3.5 模拟数据准备
- APP免费
6.3.6 常用函数
- APP免费
6.3.7 复杂数据类型
- APP免费
6.4 数据仓库搭建——ODS层
- APP免费
6.4.1 用户行为数据
- APP免费
6.4.2 ODS层用户行为数据导入脚本
- APP免费
6.4.3 业务数据
- APP免费
6.4.4 ODS层业务数据导入脚本
- APP免费
6.5 数据仓库搭建——DIM层
- APP免费
6.5.1 商品维度表(全量)
- APP免费
6.5.2 优惠券维度表(全量)
- APP免费
6.5.3 活动维度表(全量)
- APP免费
6.5.4 地区维度表(全量)
- APP免费
6.5.5 时间维度表(特殊)
- APP免费
6.5.6 用户维度表(拉链表)
- APP免费
6.5.7 DIM层首日数据装载脚本
- APP免费
6.5.8 DIM层每日数据装载脚本
- APP免费
6.6 数据仓库搭建——DWD层
- APP免费
6.6.1 交易域加购物车事务事实表
- APP免费
6.6.2 交易域下单事务事实表
- APP免费
6.6.3 交易域取消订单事务事实表
- APP免费
6.6.4 交易域支付成功事务事实表
- APP免费
6.6.5 交易域退单事务事实表
- APP免费
6.6.6 交易域退款成功事务事实表
- APP免费
6.6.7 交易域购物车周期快照事实表
- APP免费
6.6.8 工具域优惠券领取事务事实表
- APP免费
6.6.9 工具域优惠券使用(下单)事务事实表
- APP免费
6.6.10 工具域优惠券使用(支付)事务事实表
- APP免费
6.6.11 互动域收藏事务事实表
- APP免费
6.6.12 互动域评价事务事实表
- APP免费
6.6.13 流量域页面浏览事务事实表
- APP免费
6.6.14 流量域启动事务事实表
- APP免费
6.6.15 流量域动作事务事实表
- APP免费
6.6.16 流量域曝光事务事实表
- APP免费
6.6.17 流量域错误事务事实表
- APP免费
6.6.18 用户域注册事务事实表
- APP免费
6.6.19 用户域登录事务事实表
- APP免费
6.6.20 DWD层首日业务数据装载脚本
- APP免费
6.6.21 DWD层每日业务数据装载脚本
- APP免费
6.7 数据仓库搭建——DWS层
- APP免费
6.7.1 最近1日汇总表
- APP免费
6.7.2 最近n日汇总表
- APP免费
6.7.3 历史至今汇总表
- APP免费
6.8 数据仓库搭建——ADS层
- APP免费
6.8.1 流量主题指标
- APP免费
6.8.2 用户主题指标
- APP免费
6.8.3 商品主题指标
- APP免费
6.8.4 交易主题指标
- APP免费
6.8.5 优惠券主题指标
- APP免费
6.8.6 活动主题指标
- APP免费
6.8.7 ADS层数据导入脚本
- APP免费
6.9 数据模型评估及优化
- APP免费
6.10 本章总结
- APP免费
第7章 DolphinScheduler全流程调度
- APP免费
7.1 DolphinScheduler概述与安装部署
- APP免费
7.1.1 DolphinScheduler概述
- APP免费
7.1.2 DolphinScheduler安装部署
- APP免费
7.2 创建MySQL数据库和表
- APP免费
7.3 DataX数据导出
- APP免费
7.4 全流程调度
- APP免费
7.4.1 数据准备
- APP免费
7.4.2 全流程调度配置
- APP免费
7.5 电子邮件报警
- APP免费
7.5.1 注册邮箱
- APP免费
7.5.2 配置电子邮件报警
- APP免费
7.6 本章总结
- APP免费
第8章 数据可视化模块
- APP免费
8.1 Superset部署
- APP免费
8.1.1 环境准备
- APP免费
8.1.2 Superset安装
- APP免费
8.2 Superset使用
- APP免费
8.2.1 对接MySQL数据源
- APP免费
8.2.2 制作仪表盘
- APP免费
8.3 Superset实战
- APP免费
8.3.1 制作柱状图
- APP免费
8.3.2 制作旭日图
- APP免费
8.3.3 制作桑基图
- APP免费
8.3.4 合成仪表盘页面
- APP免费
8.4 ECharts可视化
- APP免费
8.5 本章总结
- APP免费
第9章 即席查询模块
- APP免费
9.1 Presto
- APP免费
9.1.1 Presto简介
- APP免费
9.1.2 Presto安装
- APP免费
9.1.3 Presto优化之数据存储
- APP免费
9.1.4 Presto优化之SQL查询语句
- APP免费
9.1.5 Presto注意事项
- APP免费
9.2 Kylin
- APP免费
9.2.1 Kylin简介
- APP免费
9.2.2 HBase安装
- APP免费
9.2.3 Kylin安装
- APP免费
9.2.4 Kylin使用
- APP免费
9.2.5 Kylin Cube构建原理
- APP免费
9.2.6 Kylin Cube存储原理
- APP免费
9.2.7 Kylin Cube构建优化
- APP免费
9.2.8 Kylin BI工具集成
- APP免费
9.3 即席查询框架对比
- APP免费
9.4 本章总结
- APP免费
第10章 集群监控模块
- APP免费
10.1 Zabbix入门
- APP免费
10.2 Zabbix部署
- APP免费
10.2.1 集群规划
- APP免费
10.2.2 准备工作
- APP免费
10.2.3 配置Zabbix yum源
- APP免费
10.2.4 安装并配置Zabbix
- APP免费
10.2.5 启动、停止Zabbix
- APP免费
10.3 Zabbix使用
- APP免费
10.3.1 术语介绍
- APP免费
10.3.2 Zabbix实战
- APP免费
10.3.3 创建模板
- APP免费
10.4 Grafana
- APP免费
10.4.1 Grafana安装部署
- APP免费
10.4.2 快速入门
- APP免费
10.4.3 集成Zabbix
- APP免费
10.5 本章总结
- APP免费
第11章 安全认证模块
- APP免费
11.1 Kerberos入门
- APP免费
11.1.1 Kerberos概述
- APP免费
11.1.2 Kerberos认证原理
- APP免费
11.2 Kerberos安装
- APP免费
11.2.1 安装Kerberos相关服务
- APP免费
11.2.2 修改配置文件
- APP免费
11.2.3 初始化KDC数据库
- APP免费
11.2.4 修改管理员权限配置文件
- APP免费
11.2.5 启动Kerberos相关服务
- APP免费
11.2.6 创建Kerberos管理员用户
- APP免费
11.3 Kerberos操作
- APP免费
11.3.1 Kerberos数据库操作
- APP免费
11.3.2 Kerberos认证操作
- APP免费
11.4 Hadoop集成Kerberos
- APP免费
11.4.1 创建Hadoop系统用户
- APP免费
11.4.2 为Hadoop各服务创建Kerberos主体(Principal)
- APP免费
11.4.3 修改Hadoop配置文件
- APP免费
11.4.4 配置HDFS使用HTTPS协议
- APP免费
11.4.5 配置YARN使用LinuxContainerExecutor
- APP免费
11.5 在安全认证模式下启动Hadoop集群
- APP免费
11.5.1 修改本地特定路径访问权限
- APP免费
11.5.2 启动HDFS
- APP免费
11.5.3 修改HDFS特定路径访问权限
- APP免费
11.5.4 启动YARN
- APP免费
11.5.5 启动HistoryServer
- APP免费
11.6 在安全认证模式下操作Hadoop集群
- APP免费
11.6.1 用户要求
- APP免费
11.6.2 HDFS操作
- APP免费
11.6.3 MapReduce任务提交
- APP免费
11.7 Hive集成Kerberos
- APP免费
11.7.1 配置要求
- APP免费
11.7.2 配置认证
- APP免费
11.7.3 启动HiveServer2服务
- APP免费
11.8 在安全认证模式下操作Hive
- APP免费
11.8.1 Beeline客户端
- APP免费
11.8.2 DataGrip客户端
- APP免费
11.9 在安全认证模式下执行数据仓库全流程调度
- APP免费
11.9.1 用户准备
- APP免费
11.9.2 修改数据采集通道
- APP免费
11.9.3 修改数据仓库各层脚本
- APP免费
11.9.4 修改数据导出DataX配置文件
- APP免费
11.9.5 修改HDFS特定路径的所有者
- APP免费
11.9.6 全流程数据准备
- APP免费
11.9.7 DolphinScheduler集成Kerberos
- APP免费
11.9.8 全流程调度
- APP免费
11.10 Presto集成Kerberos
- APP免费
11.10.1 用户准备
- APP免费
11.10.2 创建HTTPS协议所需的密钥对
- APP免费
11.10.3 修改Presto Coordinator配置文件
- APP免费
11.10.4 修改Hive Connector配置文件
- APP免费
11.10.5 配置客户端Kerberos主体到用户名之间的映射规则
- APP免费
11.10.6 配置Presto代理用户
- APP免费
11.10.7 重启Presto集群
- APP免费
11.10.8 在安全认证模式下操作Presto
- APP免费
11.11 Kylin集成Kerberos
- APP免费
11.11.1 Kerberos集成HBase
- APP免费
11.11.2 Kerberos集成Kylin
- APP免费
11.12 本章总结
- APP免费
第12章 权限管理模块
- APP免费
12.1 Ranger入门
- APP免费
12.1.1 Ranger概述
- APP免费
12.1.2 Ranger架构原理
- APP免费
12.2 Ranger安装部署
- APP免费
12.2.1 RangerAdmin安装与配置
- APP免费
12.2.2 RangerUsersync安装与配置
- APP免费
12.2.3 Ranger Hive-plugin安装与配置
- APP免费
12.3 使用Ranger对Hive进行权限管理
- APP免费
12.3.1 权限控制初体验
- APP免费
12.3.2 Ranger的权限管理模型
- APP免费
12.4 本章总结
- APP免费
第13章 元数据管理模块
- APP免费
13.1 Atlas入门
- APP免费
13.1.1 元数据管理概述
- APP免费
13.1.2 Atlas概述
- APP免费
13.1.3 Atlas架构原理
- APP免费
13.2 Atlas安装及启动
- APP免费
13.2.1 安装前环境准备
- APP免费
13.2.2 集成外部框架
- APP免费
13.2.3 Atlas Server配置
- APP免费
13.2.4 Kerberos相关配置
- APP免费
13.2.5 Atlas集成Hive
- APP免费
13.2.6 Atlas启动
- APP免费
13.3 Atlas使用
- APP免费
13.3.1 Hive元数据初次全量导入
- APP免费
13.3.2 Hive元数据增量同步
- APP免费
13.3.3 编译Atlas源码包
- APP免费
13.4 本章总结
- APP免费
第14章 数据质量
- APP免费
14.1 数据质量管理概述
- APP免费
14.1.1 数据质量管理定义
- APP免费
14.1.2 数据质量评估
- APP免费
14.2 数据质量监控需求
- APP免费
14.3 开发环境准备
- APP免费
14.3.1 Python环境准备
- APP免费
14.3.2 初始化MySQL环境
- APP免费
14.4 编写及集成检查规则脚本
- APP免费
14.4.1 编写检查规则脚本
- APP免费
14.4.2 集成检查规则脚本
- APP免费
14.5 编写报警脚本
- APP免费
14.6 调度模块
- APP免费
14.6.1 在Worker节点上安装MySQL客户端
- APP免费
14.6.2 配置工作流
- APP免费
14.7 可视化模块
- APP免费
14.8 本章总结
- APP免费
封底
更新时间:2023-11-17 16:36:26