本書系統(tǒng)、全面地介紹了大數(shù)據(jù)技術的基礎知識,期望學生通過對本書的學習和實踐了解大數(shù)據(jù)技術的概貌,掌握Hadoop生態(tài)圈大數(shù)據(jù)技術中*為基礎和關鍵的知識。主要內容包括大數(shù)據(jù)概述、大數(shù)據(jù)軟件技術基礎、大數(shù)據(jù)存儲技術、MapReduce分布式編程、數(shù)據(jù)采集與預處理、數(shù)據(jù)倉庫與聯(lián)機分析技術、數(shù)據(jù)挖掘與分析技術、Spark分布式內存計算框架、數(shù)據(jù)可視化技術、大數(shù)據(jù)安全。