8款高可用數據分析工具選擇指南——MATLAB、Excel、Python等

基於不同的應用領域,在數理統計的理論基礎上,各機構和公司推出了多款高可用的數據分析工具。本文從易用性、專業性以及應用場景等維度,著重介紹MATLAB、SPSS、Stata、SAS、EViews、Excel、Python、R這幾款工具。

8款高可用數據分析工具選擇指南——MATLAB、Excel、Python等

MATLAB

MATLAB是Matrix Laboratory(矩陣實驗室)的縮寫,是一款由美國The MathWorks公司出品的商業數學軟件。MATLAB不僅僅是一款可以用來做統計分析的軟件,它還可以高效地處理其他很多的數學問題。它常被用於各種數學建模和工程設計,相比於它強大的統計分析功能,這可說是大材小用。它具有豐富的庫函數(工具箱);內嵌繪圖功能,可實現數據的多維度展現;同時有良好的交互設計,活躍的社區以及豐富的文檔……這些都使它具有極高的易用性,我們也可使用解釋執行語言對其進行編程。

SPSS

SPSS是Statistical Product and Service Solutions的縮寫,是一款由IBM公司推出的用於分析運算、數據挖掘、預測分析和決策支持等一系列任務的軟件產品及相關服務的總稱[5]。SPSS可以用在經濟分析、市場調研、自然科學等林林總總的領域。它最大的特點是“簡單易用”。雖然它對前沿理論的支持不夠全面,但是囊括了絕大部分常用的統計方法。簡單的操作方式、友好的操作界面,再加上強大的功能,使其在國內統計分析工作領域吸引了大量用戶。

Stata

Stata是Statacorp於1985年開發出來的統計程序[6]。和SPSS一樣,它也支持常用分析方法,可用於多個領域,不過實踐中在醫學和生物學研究上的應用較多。Stata採用菜單和編程相結合的使用方式,其易用性雖不如SPSS,但在功能上略勝一籌。它在企業和學術機構的應用比較廣泛。

SAS

SAS誕生於北卡羅萊納州立大學,起初只是一個用於分析農業研究的項目。隨著需求的增長,它的使用範圍擴展至醫藥企業、銀行業以及學術和政府機關。SAS系統提供的主要分析功能包括統計分析、經濟計量分析、時間序列分析、決策分析、財務分析和全面質量管理工具等。SAS功能極其強大,算法包非常完善,但是它是純編程界面,易用性低且入門困難,適合高級數據分析師或者專業人士使用。在統計分析領域,SAS一度是“統計分析系統”的縮寫,被譽為國際上的標準軟件和最具權威性的優秀統計軟件包。

EViews

EViews是Econometrics Views的縮寫,由Quantitative MicroSoftware(QMS)開發,是一款基於Windows設計的統計分析軟件[8]。EViews可以用於常規的統計分析,但它在計量經濟分析方面特別有效。它的易用性高,且相比於上述其他分析軟件,入門級別低。針對計量經濟學相關的分析,可以首先考慮該軟件。

Excel

Excel是微軟公司為Windows操作系統編寫的一款電子表格系統,可以畫各種圖表、做方差分析、迴歸分析等基礎分析。它的專業性雖然不高,但是完全可以勝任日常工作中簡單的統計分析工作。同時,它極其方便的操作方式,以及Microsoft Office軟件包成員之一的身份,使它成為最流行的個人計算機數據處理軟件。

Python

Python是由荷蘭人Guido van Rossum於1989年發明的一種面向對象的解釋型編程語言,並於1991年公開發行第一個版本。Python是本書各種代碼實現所使用的語言。之所以把Python語言列為數據分析的工具,是因為圍繞它實現的各種數據分析與數據可視化的開源代碼庫被廣泛應用。同時,Excel、SPSS等工具雖然具有可操作的界面,但並不能有效地結合Hadoop、Hive等組件有效地處理海量數據,而這些都是Python可以勝任的。

R語言

R是專用於統計分析以及可視化的語言,是AT&T研發S語言時的產物,可以認為是S語言的另一種實現方式。同Python一樣,R也提供了極其豐富的庫函數來做統計和展現。因為R太過強大且擁有大量的用戶,為了能順應用戶的習慣,降低學習的成本,Python在數據處理上的很多庫函數都是模仿R的實現,以保持與其基本一致的使用方式。

8款高可用數據分析工具選擇指南——MATLAB、Excel、Python等


本文選自《Python絕技:運用Python成為頂級數據工程師》,作者黃文青,電子工業出版社2018年6月出版。

僅僅會Python編程是不夠的。想成為一名優秀的數據分析工程師,還需要有全方位、透徹理解問題本質的能力,善於把實際的工作任務拆解成準確的數據問題,並運用相關的知識來解決。

本書恰好是從這個角度出發的,它條分縷析地幫助你認識任務的本質,教你從數據的角度來思考、拆解任務,並最終順利地達成目標。

你正在(將要)使用哪款工具? (多選)
0
0%
MATLAB
0
0%
SPSS
0
0%
Stata
0
0%
SAS
0
0%
EViews
0
0%
Excel
0
0%
Python
0
0%
R語言


分享到:


相關文章: