hadoop實戰第三版pdf下載 最新軟件|熱門排行|軟件分類|軟件專題|廠商(shāng)大全

您的位置: 首頁教育教學電子圖書 → hadoop實(shí)戰第3版pdf中文版(bǎn) 高清免費版

hadoop實戰(zhàn)第3版pdf中(zhōng)文版

高清免費版 hadoop實戰第3版pdf中文版 網友評分:8

同類相關軟件

軟件介紹

軟件(jiàn)標簽: hadoop實戰 hadoop 電子圖書

hadoop實戰第3版pdf為讀者們從三大部分進行指導,讓讀者們可(kě)以(yǐ)通過此書快速了解Hadoop的基本知識和數據處理以及更大的係統程序,是對於Hadoop初學者們而言,提高自身能力的良好書籍,感興趣的朋友(yǒu)們快來下載吧!

本書介紹:

作為雲計算所青睞的分布式架構,Hadoop 是一個用(yòng)Java 語言實現的軟件框架,在由(yóu)大量計(jì)算機(jī)組成的集群中運行海量數(shù)據的分(fèn)布式計算,是穀歌實現雲計算的重要基石(shí).本(běn)書分為3 個部分(fèn),深(shēn)入淺出(chū)地介紹了(le)Hadoop 框架、編寫和運行Hadoop 數據處理程序所需的實踐技能及Hadoop 之外更(gèng)大的生態係統.

《Hadoop實戰》適合需要處理大量離線數據的雲計算程序員、架構師和項目經理閱讀參考.

本(běn)書目錄:

第一部分 Hadoop——一(yī)種(zhǒng)分布式(shì)編程框架

第1 章 Hadoop簡介

1.1 為什麽寫《Hadoop 實戰》

1.2 什麽是Hadoop

1.3 了解分布式係統和Hadoop

1.4 比較SQL 數據庫和(hé)Hadoop

1.5 理解MapReduce

1.5.1 動(dòng)手擴展一個簡(jiǎn)單程序

1.5.2 相同程序在MapReduce中的擴展

1.6 用Hadoop統計單詞——運行第一個程(chéng)序

1.7 Hadoop曆史

1.8 小結

1.9 資源

第2 章 初識Hadoop

2.1 Hadoop 的構造模塊

2.1.1 NameNode

2.1.2 DataNode

2.1.3 Secondary NameNode

2.1.4 JobTracker

2.1.5 TaskTracker

2.2 為Hadoop 集群安裝SSH

2.2.1 定義一個公共賬號

2.2.2 驗(yàn)證SSH安裝

2.2.3 生成SSH密鑰對

2.2.4 將公鑰分布(bù)並登錄驗證

2.3 運行Hadoop

2.3.1 本地(單機)模式

2.3.2  偽分布模式

2.3.3 全分布模式

2.4 基於Web 的集群用戶界麵

2.5 小結

第3 章 Hadoop組件

3.1 HDFS 文件操作

3.1.1 基本文件命令

3.1.2 編程讀寫(xiě)HDFS

3.2 剖析MapReduce 程(chéng)序

3.2.1 Hadoop數據類型

3.2.2 Mapper

3.2.3 Reducer

3.2.4 Partitioner:重定向Mapper輸(shū)出(chū)

3.2.5 Combiner:本地(dì)reduce

3.2.6 預定義mapper和Reducer類的單詞計數

3.3 讀和寫(xiě)

3.3.1 InputFormat

3.3.2 OutputFormat

3.4 小結

第二部分 實戰

第4 章(zhāng) 編寫MapReduce基礎程序

4.1 獲得專利數據集

4.1.1 專利引用(yòng)數據

4.1.2 專利描述數據

4.2 構建MapReduce 程序的基礎模板

4.3 計數

4.4 適應Hadoop API 的改變

4.5 Hadoop 的Streaming

4.5.1 通過(guò)Unix命令使用Streaming

4.5.2 通過腳本使(shǐ)用Streaming

4.5.3 用Streaming處理鍵/值對

4.5.4 通過Aggregate包使用Streaming

4.6 使用(yòng)combiner 提升性能

4.7 溫故知新(xīn)

4.8 小結

4.9 更多資源

第5 章 高階MapReduce

5.1 鏈接MapReduce 作業

5.1.1 順序(xù)鏈接MapReduce作業

5.1.2 具有複雜(zá)依賴的MapReduce鏈接

5.1.3 預處理和後(hòu)處理階段(duàn)的鏈接

5.2 聯結不同來源的數據

5.2.1 Reduce側的(de)聯結

5.2.2 基於DistributedCache的(de)複製聯結

5.2.3 半聯結:map側過濾後在reduce側(cè)聯結

5.3 創建一個Bloom filter

5.3.1 Bloom filter做了什麽

5.3.2 實現一個Bloom filter

5.3.3 Hadoop 0.20 以(yǐ)上版(bǎn)本的Bloom filter

5.4 溫故知(zhī)新

5.5 小結

5.6 更多資源

第6 章 編程實踐(jiàn)

6.1 開發MapReduce 程序

6.1.1 本地模式

6.1.2 偽分布模式

6.2 生產集群上(shàng)的監視和調試

6.2.1 計數器

6.2.2 跳過壞記錄

6.2.3 用IsolationRunner重新運行出錯的(de)任務

6.3 性能調優

6.3.1 通過combiner來減少(shǎo)網絡流量

6.3.2 減少輸入數據量

6.3.3 使用壓縮

6.3.4 重用JVM

6.3.5 根據(jù)猜測執行來運行

6.3.6 代碼重構與算法(fǎ)重寫

6.4 小結

第7 章 細則手冊

7.1 向任務(wù)傳遞作業定製的參數

7.2 探查任務特定信息

7.3 劃分為(wéi)多個(gè)輸出文件(jiàn)

7.4 以數據(jù)庫作為輸入輸出

7.5 保持輸(shū)出的順序

7.6 小結

第8 章 管理Hadoop

8.1 為實際應用設置特定參數值

8.2 係統體檢

8.3 權限設置

8.4 配額管理

8.5 啟用回收站

8.6 刪減DataNode

8.7 增加DataNode

8.8 管理NameNode 和SNN

8.9 恢複失效的NameNode

8.10 感知網絡布局和機架的設計

8.11 多用戶作業的調度

8.11.1 多個JobTracker

8.11.2 公(gōng)平(píng)調度器

8.12 小結

第三部分(fèn) Hadoop也瘋狂

第9 章 在雲上運行Hadoop

9.1 Amazon Web Services 簡介

9.2 安裝AWS

9.2.1 獲得AWS身份認(rèn)證憑據

9.2.2 獲(huò)得命(mìng)令行工具

9.2.3 準備SSH密鑰對

9.3 在EC2 上安(ān)裝(zhuāng)Hadoop

9.3.1 配置安全參數

9.3.2 配置(zhì)集群類型

9.4 在EC2 上運行MapReduce 程(chéng)序

9.4.1 將代碼轉移到Hadoop集群上

9.4.2 訪問Hadoop集群上(shàng)的數據

9.5 清空(kōng)和關閉EC2 實例

9.6 Amazon Elastic MapReduce 和其他AWS 服務

9.6.1 Amazon Elastic MapReduce

9.6.2 AWS導入/導出(chū)

9.7 小結

第10 章 用Pig編程

10.1 像Pig 一樣思考

10.1.1 數據流語(yǔ)言

10.1.2 數據類(lèi)型

10.1.3 用戶定義函(hán)數

10.2 安裝Pig

10.3 運行Pig

10.4 通過Grunt 學習Pig Latin

10.5 談談Pig Latin

10.5.1 數據類型和schema

10.5.2 表達式(shì)和函數

10.5.3 關係型運算符

10.5.4 執行優化(huà)

10.6 用戶定義函數

10.6.1 使(shǐ)用UDF

10.6.2 編(biān)寫UDF

10.7 腳(jiǎo)本

10.7.1 注釋

10.7.2 參數(shù)替換

10.7.3 多查詢(xún)執行(háng)

10.8 Pig 實戰——計算相似(sì)專利的例子

10.9 小結

第11 章 Hive及Hadoop群

11.1 Hive

11.1.1 安裝與配置Hive

11.1.2 查詢的示例

11.1.3 深入HiveQL

11.1.4 Hive小結

11.2 其他Hadoop 相關的部分

11.2.1 HBase

11.2.2 Zookeeper

11.2.3 Cascading

11.2.4 Cloudera

11.2.5 Katta

11.2.6 CloudBase

11.2.7 Aster Data和Greenplum

11.2.8 Hama和Mahout

11.2.9 search-hadoop.com

11.3 小結

第12 章 案例研究(jiū)

12.1 轉(zhuǎn)換《紐約(yuē)時報》1100 萬個(gè)庫存圖(tú)片文檔(dàng)

12.2 挖掘中國移動的數據

12.3 在StumbleUpon 推薦(jiàn)最佳網(wǎng)站

12.3.1 分布式StumbleUpon 的開端

12.3.2 HBase 和StumbleUpon

12.3.3 StumbleUpon 上的更多Hadoop 應用

12.4 搭建麵向企(qǐ)業查詢的分析係統——IBM的ES2 項目

12.4.1 ES2 係統結(jié)構

12.4.2 ES2 爬蟲(chóng)

12.4.3 ES2 分析(xī)

12.4.4 小結

12.4.5 參考文(wén)獻

附錄A HDFS文件命令

軟件截圖

下載地址 電腦版

點擊報錯 軟件無法下載或下(xià)載後無法使用,請點擊報(bào)錯,謝謝!

用戶評論

熱門評論

最新評論

發表評論(lùn) 查看所有評論(0)

昵稱:
請不要(yào)評論無意義或髒話,我們所(suǒ)有評論會有人工審核.
字數: 0/500 (您的(de)評論需要經過審核才能顯示)
免费人欧美成又黄又爽的视频丨一本色道久久88综合日韩精品丨国产专区日韩精品欧美色丨午夜无遮挡男女啪啪视频丨国产欧美日韩综合精品一区二区丨亚洲精品无码不卡在线播HE丨亚洲精品国产精品国自产观看丨日韩国产高清av不卡