R語言和Python一塊學習會弄混嗎?

劉秉福

恰好這兩個都學習用過,就談一下個人的看法,兩個語言都是用於大數據處理、分析與挖掘。要說一點都不混,那應該是少數人,我在前期學習的時候也老是弄混了,主要表現在以下幾點上:

格式,編程的格式上,R語言和Python是有很大的區別,R語言一個花括號,其它你隨意,Python得老老實實地按Tab鍵

一般在循環的時候,R語言代碼像下面這樣的,中間一個花括號,然後寫相應的處理邏輯,

python是這樣的,

雖然看起來差不多,但是Python有嚴格的層級關係,這種層級關係是通過一致的縮進來顯示,所以對於同一份代碼,縮進是嚴格控制的,不能一會多一個空格,一會兒少一個空格,那樣的話準報錯。

字典與數據框,python用的是字典,R用的是數據框,R是更擅長向量運算,python作為編程語言就相對弱一些,不過有相應的模塊來支持

Python的字典採用的是key-value的形式,通過唯一的key來存儲相應的數據

R的數據框則更數學化,可以理解成我們數學上學習的二元數組(最簡單的),或者直觀點的excel表格,可以通過head()函數來查看存儲的形式。

當然,學習R和Python一開始混淆的地方不止上面舉的兩個例子,有很多,但是隨著應用的多了、學習的深入,你會發現其實這些差別或者混淆只是我們對語言理解的不夠,通過多實踐、多問就可以避免的。


Bean蠶豆

參考前期的一篇文章:R vs Python / R 和 Python : 哪一種更好用?

R 和 Python 都是開源的、免費的高級編程語言。R 專門用於統計計算。它有大量附加包(package)/工具來支持機器學習和數據分析。另一方面,Python 是一種通用的強大的編程語言,在數據準備、數據調試和數據分析方面有特殊的應用。

這種區別也是不同分析人士喜歡這些編程語言的原因。Python 通常被嘗試開發數字處理和分析技能的計算機程序員所青睞。另一方面,R 被數學家和統計學家優先選擇。這些差異在這些語言的學習資源(書籍和網上論壇)中是顯而易見的。例如,考慮以下 4 本免費的在線圖書。

所有這些書都是高質量的統計教材,用 R 作為首選編程語言。這些只是幾個例子。請注意,第一本書不是專門用於 R,與第二本書有相同的作者。你很少會找到用 Python 作為首選語言的書籍。因此,R 更有能力處理數據挖掘和統計分析的相關問題。另一方面,Python 提供了非常好的應用程序來處理非結構化和複雜的數據集,如圖像、書面文本(網絡、電子郵件等)、基因、聲音等。

實質上,Python 和 R 一起構成了數據科學家的工具包。因此,對於務實的和麵嚮應用的數據科學家來說,瞭解這兩種語言的超級能力和特點是至關重要的。

使用 R 進行分析、數據可視化與建模:

  • 為分析提供了極好的靈活性

  • R 使你在分析的時候更容易思考

  • 由於有著十分活躍的統計與數學社區,可以持續的更新和增強分析功能優秀的數據可視化工具

  • 優秀的數據可視化工具

使用 Python 進行數據預處理、數據清洗,特別針對於非結構化數據(如網頁,圖像,文本等):

  • 極強的靈活性,能夠從自由文本、網站和社交媒體網站提取信息

  • 便於圖像挖掘和為分析準備數據

  • 處理大量的數據的時候比 R 語言更好

對於一個認真的數據科學家來說,R 和 Python 都應該瞭解。我們需要的是 R+Python,而不是 R vs Python。

附圖:


分享到:


相關文章: