01.23 數據“讀取-選擇-轉換-可視化-分析”過程模式,完整解讀數據價值

數據“讀取-選擇-轉換-可視化-分析”過程模式,完整解讀數據價值

前言

走在人生的路上,缺少不了旅途的增味。說到旅途,就不得不提交通工具。我國有著豐富的城市交通網絡,四通八達,如蜘蛛網般分佈在每個地方。目前,無論是海陸空,都可觸達。截止目前國家統計公佈了2019年1月到2019年11月的全國客運量的承載情況,數據細分到了鐵路客運、公路客運、水運客運以及民航客運。接下來,我們使用python語言對國家統計局公佈的鐵路客運量、公路客運量、水運客運量和民航客運量的數據進行處理、分析和可視化。

數據“讀取-選擇-轉換-可視化-分析”過程模式,完整解讀數據價值

使用python進行四種旅客客運量的分析

原始數據如下所示:

數據“讀取-選擇-轉換-可視化-分析”過程模式,完整解讀數據價值

通過python對原始數據進行相應的處理、分析和可視化。

數據“讀取-選擇-轉換-可視化-分析”過程模式,完整解讀數據價值

完整的python代碼如下:

<code>import pandas as pd
import matplotlib.pyplot as plt
#使用pd.read_csv讀取數據
data=pd.read_csv(r'/Users/lupeitao/Desktop/數據/客運量月度數據.csv',
index_col='指標',encoding='gb18030')
#進行行列轉換
data_T=data.T
#選擇數據
data_T5=data_T[['客運量當期值(萬人)','鐵路客運量當期值(萬人)',
'公路客運量當期值(萬人)','水運客運量當期值(萬人)',
'民航客運量當期值(萬人)']]
#解決mac中文字不顯示問題
plt.rcParams["font.family"] = 'Arial Unicode MS'
#x軸變量
x=data_T5.index
#四個y軸變量
y1=data_T5['鐵路客運量當期值(萬人)'].values
y2=data_T5['公路客運量當期值(萬人)'].values
y3=data_T5['水運客運量當期值(萬人)'].values
y4=data_T5['民航客運量當期值(萬人)'].values
#使用matplotlib進行數據可視化
fig,axes=plt.subplots(nrows=1,ncols=1,figsize=(15,4))
axes.plot(x,y1,marker='o',label='鐵路客運量')
axes.plot(x,y2,marker='o',label='公路客運量')
axes.plot(x,y3,marker='o',label='水運客運量')
axes.plot(x,y4,marker='o',label='民航客運量')
#添加圖例
axes.legend(loc='best')
fig/<code>

執行上述代碼,生成圖形如下:

數據“讀取-選擇-轉換-可視化-分析”過程模式,完整解讀數據價值

鐵路、公路、水運和民航客運量數據主要呈現了2019年1月到2019年11月,12月份到國家統計局官網暫未公佈,本文將其視為缺失值進行了相應操作(缺失值在使用matplotlib進行數據可視化時會自行濾除)。從上圖可知,2019年四種交通工具的客運量中,公路客運量是其中最高的,值為122062萬人。處於第二位的是鐵路客運量,鐵路客運量在2019年8月達到了峰值,值為37884萬人。民航客運量位於第三的位置,民航旅客客運量在2019年8月達到峰值,而4月是其客運量最低的時間點。水運客運量在四種旅客客運量中位於第四的位置,2019年8月也是其客運量的峰值,峰值為2970萬人,而水運客運量當期值(萬人)最低是在2019年1月,水運客運量為1513萬人。

正整體趨勢上來看,相對而言,2019年鐵路客運量在1月到11月這個區間內趨勢較為波動,鐵路客運量的變化趨勢次之,而水運客運量和民航客運量的變化趨勢相對平穩。從上圖中雖然能夠直觀上看到,水運和民航客運量的變化趨勢幾乎近似一條直線,其更為重要的原因是縱軸的客運量變化區間較大。

數據“讀取-選擇-轉換-可視化-分析”過程模式,完整解讀數據價值

總結

從上述的數據來看,公路是最受廣大旅客歡迎的交通工具。分析其原因,主要表現在兩個方面,一是公路交通網是四種交通工具中在全國網中最多且密集的。二是公路交通的靈活性更強。第二受旅客歡迎的交通工具則是鐵路,鐵路如龐大的蜘蛛網一般覆蓋全國,為廣大旅客提供便利的客運服務。與公路和鐵路相比,水運和民航相對的客運量較少。這並不是說水運和民航不重要,而是水運和民航的覆蓋度較少,相應的需求量也少,所以整體客運量相比較公路和鐵路就少許多,特別是水運。

總的來說,交通部門提供了廣大旅客蜘蛛網般的旅客客運服務,讓穿越時間和空間進行異地的交流成為可能。

數據“讀取-選擇-轉換-可視化-分析”過程模式,完整解讀數據價值


分享到:


相關文章: