
定 價:¥49.80
| 作 者: | 黑馬程序員 |
| 出版社: | 清華大學出版社 |
| 叢編項: | 大數據技術與應用叢書 |
| 標 簽: | 暫缺 |
| ISBN: | 9787302550877 | 出版時間: | 2020-04-01 | 包裝: | 平裝 |
| 開本: | 16開 | 頁數: | 394 | 字數: |
第1章 數據清洗概述
1.1 數據清洗的背景
1.1.1 數據質量概述
1.1.2 數據質量的評價指標
1.1.3 數據質量的問題分類
1.2 數據清洗的定義
1.3 數據清洗的原理
1.4 數據清洗的基本流程
1.5 數據清洗的策略
1.6 常見的數據清洗方法
1.7 本章小結
1.8 本章習題
第2章 初識ETL
2.1 基于ETL的數據清洗
2.1.1 ETL的概念
2.1.2 ETL的體系結構
2.2 ETL關鍵技術
2.2.1 數據的抽取
2.2.2 數據的清洗轉換
2.2.3 數據的加載
2.3 ETL常見工具介紹
2.4 本章小結
2.5 本章習題
第3章 Kettle工具的基本使用
3.1 Kettle簡介
3.1.1 Kettle概述
3.1.2 Kettle的設計原則203.2 Kettle的下載安裝
3.3 Kettle的基本概念
3.3.1 轉換
3.3.2 作業(yè)
3.4 Kettle的基本功能
3.4.1 轉換管理
3.4.2 作業(yè)管理
3.4.3 數據庫連接
3.5 本章小結
3.6 本章習題
第4章 數據抽取
4.1 抽取文本數據
4.1.1 TSV文件的抽取
4.1.2 CSV文件的抽取
4.2 抽取Web數據
4.2.1 HTML網頁的數據抽取
4.2.2 XML文件的數據抽取
4.2.3 JSON文件的數據抽取
4.3 抽取數據庫數據
4.3.1 抽取關系型數據庫的數據
4.3.2 抽取非關系型數據庫的數據
4.4 本章小結
4.5 本章習題
第5章 數據的清洗與檢驗
5.1 數據去重
5.1.1 完全去重
5.1.2 不完全去重
5.2 缺失值處理
5.2.1 缺失值清洗策略
5.2.2 去除缺失值
5.2.3 填充缺失值
5.3 異常值
5.3.1 出現異常值的原因
5.3.2 檢測異常值
5.3.3 刪除包含異常值的記錄
……
第6章 數據轉換
第7章 數據加載
第8章 綜合案例——構建DVD租賃商店數據倉庫