python分析全國火車站數量,東北竟然佔了2成?

“ 學習python數據分析,並帶你感受東北充滿文藝氣息的火車站”

python分析全國火車站數量,東北竟然佔了2成?


大家好,帥鳥今天給大家分享一篇有意思的文章——給全國各省火車站數量來個排名,這也是我老早之前就想做的,但是之前思路有點偏,好在迷途知返,今天終於能給大家見面了。下面一起來看看排名情況吧。

第一步:給各個火車站按省歸類


走過的坑:之前我先去12306上把所有的火車站名字爬了下來,然後做個地圖網站爬蟲,爬取所有車站的詳細地址信息,但是有幾百個不常見的火車站搜不出來,遂作罷;然後又做個百度百科爬蟲,逐個把火車站的地址信息提取出來,但是又是幾百個火車站在百度百科沒有地址信息,有的還是地鐵站名(oh my god),遂又放棄。

直到前幾天,我遇到了下面這個網站:

python分析全國火車站數量,東北竟然佔了2成?

真是踏破鐵鞋無覓處,得來全不費功夫

所有火車站都在,我不禁感慨了一下之前在坑裡逝去的青春

這是個很簡單的靜態網頁,直接開始寫爬蟲:

python分析全國火車站數量,東北竟然佔了2成?


簡單介紹一下上面的代碼,很適合初學者練手,首先將第一個網頁中把各省的鏈接找到(province_items),提取href組成url2,再把每個省和對應的火車站數量len(trainName)存入字典中。

最後根據字典再把相應數據存入表格中

python分析全國火車站數量,東北竟然佔了2成?


第二步:數據可視化


1.畫出各省火車站數量熱力圖

python分析全國火車站數量,東北竟然佔了2成?


python分析全國火車站數量,東北竟然佔了2成?


由圖可以看出,從南至北火車站數量呈現遞減趨勢,我原本想著發達地區的火車站數量應該多一些,畢竟“要想富先修路”,但是實際並不是這樣,看來東南沿海應該是水路航線多一些(我瞎猜的)。

2.畫出排名前二十的柱狀圖

python分析全國火車站數量,東北竟然佔了2成?


python分析全國火車站數量,東北竟然佔了2成?

排名第一的是黑龍江,總共有302個火車站,另外我們可以發現東北三省都在前五名中,數量都在130以上,下面再深入研究一下東北三省的火車站數量。

3.畫出東北三省火車站數量佔比餅狀圖

python分析全國火車站數量,東北竟然佔了2成?


python分析全國火車站數量,東北竟然佔了2成?

三個省佔了全國21%的比重,這個比例還是相當大的,

4.畫出黑龍江省內火車站位置散點圖

python分析全國火車站數量,東北竟然佔了2成?

大家注意一下,上面熱力圖用的是Map函數,這裡散點圖用的是Geo函數,這倆是有區別的。

python分析全國火車站數量,東北竟然佔了2成?

由圖可以看出,黑龍江省內火車站相當密集,每條鐵路線上火車站間隔也比較小。

那麼為什麼東北會有這麼多火車站呢?

這是歷史特殊時期的產物,上個世紀初期東北有豐富的煤礦資源,修建鐵路主要是鬼子和毛子掠奪資源,這個就是東北三省鐵路眾多的主要原因。另外,東北三省雖然鐵路秘籍,但是由於年代稍久了,鐵路質量和規格不是很高。相對於南方來說,鐵路是東北這邊的主要交通工具,由於地域遼闊,修建鐵路建設成本會相對較低。這就是這邊有很多小火車站的原因。

但是歷史也為東北留下了一些充滿文藝氣息的火車站,這些火車站既有時代的烙印,也有現代的美觀,下面讓我們一起感受一下吧!

python分析全國火車站數量,東北竟然佔了2成?

(亞布力南站,是我國首個滑雪場火車站)


python分析全國火車站數量,東北竟然佔了2成?

(橫道河子站,西洋畫裡的俄羅斯城堡)


python分析全國火車站數量,東北竟然佔了2成?

(吉林西站,過去叫做黃旗屯站)


python分析全國火車站數量,東北竟然佔了2成?

(旅順站 國內保存最完整的歐式站臺)


雖然我不是東北人,更沒有去過以上的火車站,但是看了照片心卻心生嚮往,以後有時間一定要親臨其境感受一下藝術的氣息。

本文代碼已上傳,請在公眾號“python的爬蟲與數據分析之路”後臺輸入:火車站獲取


精彩回顧:

用python製作全國身份證號驗證及查詢系統

盤點pyhton常見的黑客技術(一) 超簡單

12行python代碼實現員工智能簽到

北京的房價到底有多貴?我爬取了3萬多條數據得出分析結果


分享到:


相關文章: