學習大數據要有哪些預備知識?

戴上面具談人生


大數據是我的研究方向之一,所以我來回答一下這個問題。

大數據產業鏈圍繞數據展開,有數據採集、整理、傳輸、存儲、安全、分析、呈現和應用,涉及到諸多學科的綜合使用,不同的崗位需要的基礎知識也不盡相同。下面我以大數據工程師崗位,粗粒度的介紹一下大數據的基礎知識。

第一,操作系統知識。大數據平臺往往搭建在Linux操作系統之上,所以大數據工程師要有Linux系列操作系統的知識。

第二,數據庫基礎。大數據一個重要的內容是數據存儲,要掌握傳統數據庫知識,包括建庫、建表、Sql語句的使用等等。當然在學習大數據的時候還要學習Nosql數據產品。

第三,網絡基礎。大數據的數據來源於網絡,尤其是物聯網系統,所以掌握網絡基礎知識對學習大數據來說非常重要。

第四,程序設計基礎。在大數據領域使用比較廣泛的編程語言有Python、R、Java、Scala等語言,這些編程語言也是比較常見的,所以掌握其中一門語言對學習大數據來說是至關重要的。

第五,算法基礎。大數據分析需要使用到很多算法,學習大數據要了解常見的算法,比如k近鄰、決策樹、樸素貝葉斯、支持向量機、迴歸等。

我目前在帶大數據團隊,對大數據領域比較熟悉,我會陸續在頭條上寫一些關於大數據方面的科普文章,感興趣的朋友可以關注我的頭條號,相信一定會有所收穫。

如果有大數據方面的問題,也可以諮詢我。

謝謝!


分享到:


相關文章: