數據遷移工具 Sqoop

Sqoop(SQL to Hadoop)是一個用來將 Hadoop 和關係型數據庫中的數據相互轉移的工具 ,可以將一個關係型數據庫(例如 : MySQL、 Oracle 、 PostgreSQL 等)中的數據導入到 Hadoop 的 HDFS 中,也可以將HDFS 的數據導入到關係型數據庫中。

Sqoop 工作機制利用 MapReduce 分佈式批處理,加快了數據傳輸速度,保證了容錯性。

數據遷移工具 Sqoop

專欄

Hadoop v3.1大數據技術快速入門

作者:軟件架構

19.8幣

50人已購

查看

選擇 Sqoop 的理由通常基於三個方面的考慮:

(1)它可以高效地利用資源,可以通過調整任務數來控制任務的併發度。

(2)它可以自動地完成數據類型映射與轉換。

(3)它支持多種數據庫,比如 MySQL 、 Oracle 和 PostgreSQL 等數據庫。

數據遷移工具 Sqoop

Sqoop發展至今主要演化了兩大版本,Sqoop1和 Sqoop2。 Sqoop1的最高版本為 1.4.7,如圖所示。而Sqoop1.99.7 屬於 Sqoop2。 Sqoop1和Sqoop2是兩個完全不兼容的版本。

專欄

Kafka v2.3 快速入門與實踐

作者:軟件架構

29.6幣

62人已購

查看


分享到:


相關文章: