Hadoop大數據開發例教程與實戰案例——總計7.7G

前言

Hadoop是一個由Apache基金會開發的開源軟件,

具有可靠性、擴展性的分佈式的計算存儲系統,標識性Logo為一個黃色小象。Hadoop 軟件庫作為一個框架,它可以輕鬆地通過1臺到數千臺服務器聯合在一起實現對大數據進行存儲和計算,而且每一個都能提供存儲和計算能力。

Hadoop大數據開發例教程與實戰案例——總計7.7G

Hadoop大數據開發案例教程與項目實戰

Hadoop的框架核心的設計是HDFS和MapReduce。HDFS為海量的數據提供了存儲,而MapReduce為海量的數據提供了計算。

Hadoop項目主要包括4個部分。

  • Hadoop Common:支撐其他模塊。
  • Hadoop Distributed File System:分佈式系統對應用提供高吞吐量的訪問。
  • HadoopYarn:資源管理和任務調度的一-個框架。
  • Hadoop MapReduce:能夠並行處理大數據集的Yarn基本系統。

Hadoop相關項目

在Apache項目中和Hadoop相關聯的項目有很多,常見的項目包括:

( 1 ) Ambari

Apache Ambari是-種基於Web的工具,支持Apache Hadoop集群的供應、管理和監控。Ambari目前已支持大多數Hadoop組件,包括HDFS、MapReduce、Hive、 Pig、Hbase、Zookeeper . Sqoop和Hcatalog等。Ambari也提供了一種儀 錶盤用來查看集群健康狀況, Pig和Hive以友好的方式展示特有的特徵。

(2) Avro

Avro是-一個比較流行的數據序列化系統,可以提供豐富的結構類型,快速可壓縮的二進制數據格式,存儲持久化數據,支持遠程過程調用協議( Remote Procedure Call Protocol,RPC )。

(3 ) Cassandra。

Cassandra是一套開 源分佈式NoSQL數據庫系統。它最初由Facebook開發,用於儲存收件箱等簡單格式數據,集合Google BigTable 的數據模型與Amazon Dynamo的完全分佈式的架構於一身。Facebook於2008年將Cassandra 開源,此後,由於Cassandra良好的可擴展性,被Digg、Twitter 等知名Web 2.0網站所採納,成為了一種流行的分佈式結構化數據的存儲方案。


小編只是列舉了幾個案例,想獲取其他案例的可以私信【學習】獲取哦~~~


Hadoop在線測試


Hadoop大數據開發例教程與實戰案例——總計7.7G


Hadoop大數據開發例教程與實戰案例——總計7.7G

Hadoop大數據開發例教程與實戰案例——總計7.7G

Hadoop開發實戰案例分享

下面是小編整理的一些關於Hadoop的資料,有適合新手的和適合大神級別的,由於資料比較多小編把它整理成文檔和視頻的形式,希望大家會喜歡!

獲取方式:轉發文章並私信小編【學習】即可獲取哦~~~


Hadoop大數據開發例教程與實戰案例——總計7.7G

Hadoop大數據開發例教程與實戰案例——總計7.7G


分享到:


相關文章: