本書由淺入深地介紹了Hadoop技術生態(tài)的重要組件,讓讀者能夠系統(tǒng)地了解大數據相關技術。第1章主要從整體上介紹了Hadoop大數據技術,并搭建Hadoop運行環(huán)境。第2~5章著重介紹了Hadoop核心技術,包括Hadoop分布式文件系統(tǒng)(HDFS)、Hadoop資源管理系統(tǒng)(YARN)、Hadoop分布式計算框架(MapReduce)以及ZooKeeper分布式協(xié)調服務。第6章重點介紹了Hadoop分布式集群的搭建以及集群的運維與管理。第7~8章詳細介紹了Hive數據倉庫和HBase分布式數據庫等Hadoop的上層技術組件。第9章介紹了 \nHadoop生態(tài)圈其他常用開發(fā)技術。第10~11章是項目實戰(zhàn),分別介紹了互聯網金融項目離線分析、互聯網直播項目實時分析。 \n本書采用理論知識和實戰(zhàn)項目相結合的方式,突出實戰(zhàn),非常適合Hadoop 初學者及開發(fā)者閱讀。本書既可以作為高等院校數據科學與大數據技術及相關專業(yè)的教材,也可以作為大數據工程師的必備開發(fā)手冊。 \n