研究生的專業是大數據,有什麼建議?

溫兒兒

大數據是我的主要研究方向之一,同時對研究生階段的大數據專業比較瞭解,我想我可以來回答這個問題。在回答這個問題之前首先要了解大數據的學科特點,大數據的核心課程是什麼?大數據工具有哪些?大數據的行業應用有哪些?


大數據的學科特點


大數據與很多學科都有關係,比如計算機、統計、數學(應用數學)、信息科學等,作為一門新興學科,大數據還與經濟學、管理學、社會學以及新聞學都存在比較密切的聯繫。大數據本身的核心內容包括數據採集、存儲、傳輸、分析等內容,所以大數據的課程內容也圍繞這些核心部分展開。

目前很多高校和科研院所都按照跨學科的方式來培養大數據人才,在人才培養方案上通常是多學科專家共同制定培養方案。在核心課程的設置上多參考以鄂維南院士為代表的北京大學大數據課程體系,其中以數據科學導引、複雜網絡、大數據算法、統計學為主,輔以培養單位各自特點豐富其他內容(數據挖掘、文本分析、多媒體數據處理識別等),所以大數據專業的研究生一定要把這部分核心課程內容掌握好。

大數據和機器學習密不可分,機器學習作為AI(人工智能)的一部分在大數據時代得到了長足的發展。在數據識別、分析歸類等方面需要藉助機器學習來完成,所以在學習大數據的同時要對機器學習進行深入的學習。機器學習的基礎就是對機器學習算法的瞭解,比如在機器學習領域應用較廣的KNN、支持向量機、決策樹、神經網絡、貝葉斯、迴歸等算法。結合這些算法進行進一步的實踐,通過對數據的收集、分析來訓練算法,最終來使用算法完成業務處理。


大數據工具


目前大數據平臺的學習多以Hadoop、Spark為主,大數據平臺的搭建和實驗也需要大量的時間。通常從搭建Hadoop平臺開始,逐步學習Hbase、Pig、Hive、Spark、Zookeeper、Sqoop、Hama等等一系列框架產品。

搭建Hadoop平臺需要從瞭解Linux系統開始,然後動手搭建分佈式平臺、安裝組件、測試平臺、編寫算法、測試算法等。

這部分內容雖然難度不大但是內容較多,需要長時間不間斷學習和實踐才能掌握。動手能力的培養對研究生階段的學生來說是非常重要的,通過對已有數據的分析來驗證算法的合理性是重要的課題方向。


大數據的行業應用

大數據的學習除了要把之前提到的核心學科和大數據工具學好之外,還要了解大數據的行業應用。

大數據在很多領域都有應用,比如金融、交通、政務、工業、醫療、公益等領域,在研究生階段要對這些領域的大數據應用方案有一定的瞭解,最好深入某個領域做一個具體的解決方案。

大數據的學習過程是比較辛苦的,不僅要有紮實的理論基礎還要有動手能力的鍛鍊,知識量大、複雜程度高、難度大、實驗週期長,但是大數據的前景十分廣闊,很多領域都急需大量專業的大數據人才,所以說學習大數據專業是個非常不錯的選擇。

希望選擇大數據專業的研究生同學學有所成!如果有專業方面的問題,也可以私信我,一起交流。



IT人劉俊明

你好,研究生是在社會基本算是高端人才了。

從目前的社會發展情況來看,大數據一定是未來至少10年的熱點。任何系統、任何公司的核心都是數據。現在流行hadoop,流行內存計算、內存數據網格等等。未來,還會有更多的概念和技術,但其本質還是離不開數據,都是為大數據服務。

數據TB、PB、EB、ZB、YB、的飆升,將誕生一系列新的技術和產業。而對技術人員,新生的數據科學家Data Scientists,將是最有發展前景的職業。有機會的話,可以選擇尚硅谷大數據Hadoop進行系統化的學習。

希望,我的回答對您有所幫助。


分享到:


相關文章: