本書提供了學習大數據技術及架構的一站式解決方案,覆蓋了大數據生態(tài)圈中的完整技術體系,包含以下內容。.一、數據采集日志數據采集工具(Flume 、Logstash、Filebeat )數據庫數據采集工具(離線采集工具——Sqoop、DataX,實時數據采集工具——Canal、Maxwell 網頁數據采集工具物聯網數據采集工具消息隊列中間件.二、數據存儲分布式文件存儲之HDFSNoSQL數據庫之HBaseNoSQL數據庫之Redis.三、離線數據計算離線計算引擎MapReduce離線計算引擎Spark.四、實時數據計算實時計算引擎Storm實時計算引擎Spark Streaming新一代實時計算引擎Flink.五、OLAP數據分析 離線OLAP引擎(Hive、Impala、Kylin)實時OLAP引擎(Druid、ClickHouse、Doris).六、全文檢索引擎 Lucene SolrElasticsearch.七、分布式任務調度系統(tǒng)AzkabanOoizeDolphinScheduler.八、分布式資源管理 YARN的原理、架構YARN中的資源調度器【實戰(zhàn)】配置和使用YARN多資源隊列.九 、大數據平臺搭建工具 大數據平臺工具HDP大數據平臺工具CDH大數據平臺工具CDP.本書還介紹了多個企業(yè)級大數據應用案例(包括海量數據采集、“雙十一”數據大屏、海量數據全文搜索系統(tǒng)等)和大數據平臺架構案例(包括離線數據倉庫架構、實時數據倉庫架構、批流一體化數據倉庫架構、數據中臺架構、直播大數據平臺架構、電商大數據平臺架構等),可以幫助讀者從全局角度理解大數據。.在本書中,技術內容基本上都是從零講起的,結合原理和架構,以“圖解 實戰(zhàn)”的形式幫助讀者輕松理解復雜的知識。