8 行代碼用Python畫一箇中國地圖

Jupyter

首先,第一神器是Jupyter。如果你是第一次使用,可能搞不清楚它的開發者做這麼個鬼東西出來幹什麼,說它是博客系統也不像,說它是web服務器也不像,但它就是有用。

因為我們傳統的web開發首先想的就是面向公眾,你做一個服務器就是要服務成千上萬瀏覽器的。

當然Jupyter也可以服務眾多瀏覽器,但它更多的還是方便研究人員,對研究人員來說簡直是太方便了,你把代碼像寫文章一樣直接寫在輸入框裡,然後在本頁面直接就看到了這個代碼的結果,隨時修改,隨時展現,文碼混排,是Markdown的一個增強版,畢竟Markdown還只能顯示文字,最多再加上一些圖片,而Jupyter是可以直接運行Python代碼的。

當然,也有些人試圖在Jupyter裡運行PHP或Java代碼,但顯然成不了氣候。因為Python這個語言天生就是腳本語言,可能將來唯一有希望往裡移植的就是Javascript,這貨也是一個腳本語言。腳本語言的好處就是不用編譯,一行一個結果。

縱觀計算機語言發展歷史,就是一個從繁到簡的過程,C語言需要編譯+鏈接才能運行,Java只要javac一下,把編譯和鏈接合二為一,PHP更簡單,直接運行就行了,連編譯都省了。

但是還不夠直接,因為還要編寫一個.php文件存盤,然後才能運行,到了Python以及其它腳本語言這裡,可以直接在殼裡運行,但最大的問題是運行可以運行,無法保存,要保存就又要跟傳統方式一樣,找個編輯器來,或者vi,存成文件以後才可以運行。

Jupyter最大的優點就是:它本身還是一個外殼環境,可以運行腳本,但同時也幫你自動把這些腳本代碼保存了下來,不但保存腳本代碼,並且你插在腳本代碼當中的所有註釋不是普通註釋,而是各種格式化的Markdown都一併幫你保存下來,並且可以隨時修改。

所以它兼具了腳本外殼和文件管理系統的優點,從此你開發Python代碼再也不用先在IDE裡寫好代碼,然後再到終端裡去運行,而直接在一個web頁面上就全部搞定了。

Java有這樣的工具嗎?PHP有這樣的工具嗎?沒有,所以我們必須選擇Python。

Pandas

第二神器是Pandas。如果我讓你讀取一個csv文件,然後求每一列數據的平均值,最大值,最小值,方差,用Java或PHP怎麼做?

你首先要fopen一個文件,然後一行一行讀進來,再給它整個數據結構,然後弄個循環計算,最後你可能還要fclose這個文件。

總之代碼一坨,麻煩死。而Python語言因為有Pandas這個神器,一行代碼搞定:

df = pd.read_csv( a.csv )

行了,從此以後,df就是這個DataFrame,它本身就是一個強大的數據結構,也可以把它理解成mysql數據庫中的一張表吧,各種增刪改查,求總和,求平均都是一行代碼的事情。

所以有這樣強大的庫,研究人員有什麼理由選擇Java?

scikit-learn

第三神器scikit-learn,一般縮寫為sclearn,各種機器學習算法,基本上只要你能想得到的,線性迴歸,邏輯迴歸,SVM,隨機森林,最近鄰居等等等等,各種算法全部在這裡面(http://scikit-learn.org/stable/user_guide.html)。

簡而言之,只有你想不到,沒有它做不到。

所以這就是為什麼玩機器學習必選Python的原因,你給我找一個Java或者PHP有這樣多種算法的庫來?

在這裡小編也準備了一份python學習資料,關注,轉發,私信小編“007”即可免費領取!

8 行代碼用Python畫一箇中國地圖

matplotlib

第四神器是matplotlib。如果我讓你根據上面csv文件裡的信息,畫一個圖,用Java該怎麼做?

你當然會去找第三方插件庫,然後又是一通折騰,終於把圖做出來,然後編譯,然後運行。

如果我要改配色呢?如果我要求畫地圖呢?如果要畫熱力圖呢?那個麻煩就不是一星半點,而對於matplotlib來說,簡直就是小菜一碟。

簡單的直方圖就不說了,下面重點介紹如何用matplotlib配合Basemap畫一箇中國地圖。

安裝Basemap

先安裝相應的組件。我假定你已經都安裝好了Python以及Jupyter等等。如果沒有安裝的話,就去嘗試一下brew install python3和brew install jupyter吧,網上有很多教程。

然後你需要用pip3 install很多我們下面可能需要用到的庫。但是因為我們要用一個叫做Basemap的庫,而這個庫沒有辦法用簡單的pip3 install安裝,所以稍多兩個步驟:

brew install geos  

pip3 install https://github.com/matplotlib/basemap/archive/v1.1.0.tar.gz

開始畫圖

啟動Jupyter之後,我們還是本著從最簡單的代碼開始。先畫一個世界地圖:

import matplotlib.pyplot as plt
from mpl_toolkits.basemap import Basemap
plt.figure(figsize=(16,8))
m = Basemap()
m.drawcoastlines()
plt.show()

前面兩行引入相應的庫,真正的代碼就4行,夠簡單吧。第1行甚至可以不寫,它定義了圖的大小。第2行我們創建一個地圖,第3行把海岸線畫上,第4行顯示這個地圖,就是這樣:

8 行代碼用Python畫一箇中國地圖

你用Java的4行代碼畫一個地圖出來?

然後我們開始畫上國家,又是1行代碼:

m.drawcountries(linewidth=1.5)

就變成了這樣:

8 行代碼用Python畫一箇中國地圖

用Java可能嗎?用PHP可能嗎?

如果我們想顯示中國地圖,只需要在創建Basemap時指定一下經緯度就行了:

m = Basemap(llcrnrlon=73, llcrnrlat=18, urcrnrlon=135, urcrnrlat=53)

然後就得到了中國地圖:

8 行代碼用Python畫一箇中國地圖

看上去有點變形,這是因為我們沒有添加任何投影的原因,Basemap提供24種不同的投影方式,你可以自己一個個試一下,比較常用的是蘭勃特投影,我們添加一下:

m = Basemap(llcrnrlon=77, llcrnrlat=14, urcrnrlon=140, urcrnrlat=51, projection= lcc , lat_1=33, lat_2=45, lon_0=100)

這次終於看上去比較正常了:

8 行代碼用Python畫一箇中國地圖

我們想加上省的邊界怎麼辦呢?Basemap缺省的包裡沒有中國的省區,只有美國的州,畢竟是美國人做的嘛。

不過好在世界很大,有專門的國際組織幹這事,在這裡(https://gadm.org/download_country_v3.html)你可以下載全世界任何一個國家的行政區劃Shape文件,然後我們給它加上:

m.readshapefile( CHN_adm_shp/CHN_adm1 , states , drawbounds=True)

然後就得到了下圖:

8 行代碼用Python畫一箇中國地圖

再往後,你還可以往圖上改顏色啦,寫數字啦,這些就留待你研究吧。總之,我想說的是,用Python畫地圖真的超容易。


分享到:


相關文章: