如何學習“大數據”方面的知識?

用戶8328945825930


大數據這個名詞對於圈子裡的同行是非常熟悉的,都知道大數據是個很牛逼的代名詞,首先大數據的概念是指在一定時間範圍內用常規軟件工具進行捕捉,管理和處理的數據集合,是需要新處理模式才能具有更強的決策力,洞察發現力和流程優化能力的海量,高增長率和多樣化的信息資產。大數據解釋起來是這麼回事,可能外行人聽起來丈二和尚摸不著頭腦,那麼就需要自己多花時間去補充這方面的知識,要了解和學習一門技術,就得把這門技術的前和後都瞭解清楚,基於我個人的觀點,對於大數據的學習,最基本的大數據組件Hadoop+Spark這個是必須掌握的基礎,後面延伸的Hive,HBase等組件,盡然是對數據的處理,那麼就少不了和數據庫打交道,Sql語句那就是最基本的數據庫語言,對於這類都是高級編程語言,那麼還要掌握一門編程語言,目前市面上都是推薦Java和Python,如果是我推薦的話,偏向於Python,這個是針對零基礎的朋友,關於Python我這裡不多加介紹了,對於大數據技術的學習上面只是介紹了幾個必學的組件,學起來肯定是困難的,學成之後就會封神了,哈哈!在學習過程中一定要沉靜下心來學習,不能浮躁,多問多實操!理論基礎要紮實然後結合項目來實戰自己所掌握的理論,相輔相成,一定會有成。




蟲師的成長之路


大數據如何學習

  一、基礎知識學習:

  1、如果您此前對於數據庫等方面的知識沒有涉及,在學習大數據之前,建議先掌握基本的數據庫知識,例如目前流行的關係型數據庫管理系統MySQL, 非關係型數據庫MongoDB,開源、支持網絡、基於內存、鍵值對存儲數據庫Redis等相關的知識;

  2、Java 是目前使用最為廣泛的編程語言,它具有的眾多特性,特別適合作為大數據應用的開發語言。由於Java目前有不同的方向,如果是關於大數據方面可以著重學習標準版JavaSE;

  3、能夠熟練掌握Linux系統,由於大數據相關的軟件都是在Linux上運行,因此能夠熟練使用Linux系統對大數據相關軟件的操作相當重要,也能夠對後面學習理解hadoop、HBase等大數據的軟件的運行原理;

二、Scala基礎:

Scala 是一種多範式的編程語言,其設計的初衷是要集成面向對象編程和函數式編程的各種特性。由於 Scala 運行於 Java 平臺(Java 虛擬機),併兼容現有的Java 程序,所以 Scala 可以和大數據相關的基於 JVM 的系統很好的集成;

三、Hadoop技術模塊;

Hadoop是一款支持數據密集型分佈式應用並以 Apache 2.0 許可協議發佈的開源軟件框架,它能搭建大型數據倉庫,PB 級別數據的存儲、處理、分析、統計等業務。它擁有高容錯率的特點,設計是用來部署在低廉硬件上;這個平臺目前已經成為了大數據的代名詞,通過對Hadoop的學習就能夠明白並使用大數據;

四、Spark技術模塊;

Spark 和 Hadoop 都是大數據框架。Hadoop 提供了 Spark 所沒有的功能特性,比如分佈式文件系統,而 Spark 為需要它的那些數據集提供了實時內存處理。所以學習 Spark 也非常必要;

五、大數據項目實戰;

在經過以上的學習之後,需要進行大數據項目的實踐,通過進行建模、分析和運算最終將學到的知識用於實踐當中;

以上就是關於大數據如何學習的解答,希望可以幫助到大家




分享到:


相關文章: