用 Python 預測新冠肺炎疫情發展

愛學習的美少女

2020-03-30 10:34:39

目前整個世界同新冠肺炎的鬥爭仍在繼續，從新冠肺炎爆發以來，很多人都提出了各種各樣的模型來預測肺炎疫情的發展，其中比較常見的就是SIR模型。這是因為SIR是目前疾病防控領域最經典也是最常用的一個模型，而今天筆者就用圖論來講述一下SIR模型。

首先對SIR模型做一個簡單的介紹，SIR全稱就是Susceptible—Infected—Recovered，翻譯過來就是易感—感染—康復，即易感人群Susceptible有α概率被某種疾病感染，成為感染人群Infected，而感染人群Infected又有β概率康復，成為康復人群Recovered。這個過程可以是一次或者是多次的，而且還衍生出不少類似的模型，比如SIS、SIRS和SI等。整個SIR過程可以用下圖來描述。

圖1. SIR模型示意圖

而筆者這次用的是圖論，也就是我們平常所說的網絡分析來說明SIR模型，大概過程如下圖所示。

圖2. SIR網絡模型示意圖

這個過程其實很簡單，就是由少數人感染多數人，然後最終所有感染人群都康復的一個過程，這個模型簡化了我們很多實際情況所遇到的部分問題，比如不考慮感染人群的死亡問題，不考慮感染人群的再感染等等。這次用到的圖論方面的庫是networkx，這是Python中最常用的圖論分析的庫。下面還是直接用代碼來具體說明一下。

首先導入各種包。

<code>import matplotlib.pyplot as plt
import numpy.random as rdm
import networkx as nx/<code>

接下來定義兩個變量n和g。n是總人數，而nx.erdos_renyi_graph則是一種隨機網絡圖，Erdos和Renyi是兩位匈牙利數學家，他們的主要貢獻就是建立了著名的E-R隨機圖理論（Random graph theory），這被公認為在數學上開創了複雜網絡拓撲結構的系統性分析。而這個E-R圖也是本文應用的基礎。而nx.erdos_renyi_graph(n, 0.01)的意思就是以概率0.01來連接100個節點。這裡100和0.01這兩個數字筆者用的比較隨意，大家可以根據自己的研究來任意設定相關數值，這裡主要還是用於簡單說明。然後是三個string類型的變量susceptible、infected和recovered，分別代表“易感”、“感染”和“康復”人群。

<code>n = 100
g = nx.erdos_renyi_graph(n, 0.01)
susceptible = 'S'
infected = 'I'
recovered = 'R'/<code>

接下來我們要定義幾個函數。

<code>def onset(g): #初始設置
    for i in g.node.keys():
        g.node[i]['state'] = susceptible

def infect_prop(g, proportion): #設置感染比例
    for i in g.node.keys():
        if(rdm.random() <= proportion):
            g.node[i]['state'] = infected

def build_model(pInfect, pRecover): #模型構建
    def model(g, i):
        if g.node[i]['state'] == infected:
            for m in g.neighbors(i):
                if g.node[m]['state'] == susceptible:

                    if rdm.random() <= pInfect:
                        g.node[m]['state'] = infected
            if rdm.random() <= pRecover:
                g.node[i]['state'] = recovered
    return model

def model_run(g, model): #單次模型運行
    for i in g.node.keys():
        model(g, i)

def model_iter(g, model, iter): #多次模型循環
    for i in range(iter):
        model_run(g, model)/<code>

第一個函數onset，也就是剛開始的狀態，在這裡我們把每個節點的狀態都設置為“S”，也就是易感的意思，這裡我們假設所有人都屬於易感人群中的。然後就開始有部分人群出現感染，而這個感染函數就是infect_prop，prop意思就是proportion，這個函數的意思就是感染比例，這裡我們用到了numpy.random.random方法，也就是返回一個均勻分佈，數值大小在0-1之間，不包含1，當rdm.random()<= proportion時，我們就讓這樣的人群變為感染人群，這樣讓感染人群更加均勻一些。第三個函數是build_model，是一個嵌套函數，有兩個參數，pInfect和pRecover，分別代表感染概率和康復概率，而這裡的g.neighbors(i)的意思是節點i的每個相鄰的節點，而g是我們生成的一個圖（graph），是一個class，後面會有說明。在這些感染人群中，當他們的相鄰節點的狀態是“susceptible”時，我們讓這些節點（人群）以概率pInfect來進行感染；而在這些感染人群中，以pRecover的概率進行康復。這就是一個簡單的感染—康復過程。而後面的兩個函數model_run和model_iter則是將這個模型運行一次和多次，分別用來模擬一個循環和多個循環。

接下來就是畫圖。

<code>fig, ax= plt.subplots(figsize=(12, 10))
ax.set_xticks([])
ax.set_yticks([])
pos = nx.spring_layout(g, k=0.2)
nx.draw_networkx_edges(g, pos, alpha=0.5, width = 1)
nx.draw_networkx_nodes(g, pos, node_size=80)
plt.show()/<code>

首先設置圖片的大小，並去掉座標軸，然後設置網絡圖的位置，nx.spring_layout就是設置網絡圖的位置的方法，k是節點間的最佳距離，這個可以隨意設置，值越大節點越分散，接下來繪製節點和連線，nx.draw_networkx_nodes(g, pos, node_size=80)用來繪製節點，pos就是剛才設置的位置參數，再設置一下節點的大小，而nx.draw_networkx_edges(g, pos, alpha=0.5, width = 1)用來繪製連線，同樣要傳入位置參數，再設置透明度和線寬。最後生成的圖如下。

圖3. 模型生成的網絡圖

networkx使用的繪圖算法是隨機的，同時我們使用的參數也是隨機的，所以這個圖每次生成的結果都不同，但大體相似，我們可以看到這裡面已經有部分節點相連，疾病也就是通過他們開始傳播。

最後就是計算感染率。

<code>onset(g)
infect_prop(g, 0.05)
model = build_model(0.2, 0.8)
model_iter(g, model, 10)
infected = [ v for (v, attr) in g.nodes(data = True) if attr['state'] == recovered ]
infection_rate = len(infected)/n
print(infection_rate)/<code>

這當中onset(g)中的g就是前面我們用g = nx.erdos_renyi_graph(n, 0.01)生成的圖，這是一個類的實例，infect_prop(g, 0.05)中的0.05就是設置人群初始感染率為0.05，model = build_model(0.2, 0.8)中的感染幾率和康復幾率分別設置為0.2和0.8，至於為何這麼設置，主要是根據常用的“二八理論”，這個數字可以根據使用者的模擬情況隨意設置，而model_iter(g, model, 10)中我們讓這個模擬過程重複10次，最後計算出感染人數，並得出最終穩定的感染率infection_rate，因為這些參數不少都是隨機的，所以得出的結果理論上每次都是不同的，筆者得出的結果從0.03到0.12不等，這個結果意義不大，主要還是理解模擬的方法。

PYTHON，幫我命名截圖

Python+scrapy爬蟲識別驗證碼（四）手繪驗證碼識別

用數據一窺如今最流行的編程語言—Python！

基於 Python 的新冠病毒傳播仿真器！

很多推崇學 Python 入行的，如果學完 Python 找不到工作怎麼辦？

Python 爬取b站熱門視頻信息並導入Excel表格

python 函數封閉調用

Python 應該怎樣學？

每天學習倆小時java、Python,前段，你還愁沒工作嗎？

為什麼你現在必須遷移到 Python 3？

Python Excel處理數據之旅-

視頻教程+案例，java、python、前端全套

Python 閒談 15——用Python生成屬於自己的頭條二維碼

Python 進階之遞歸函數一點都不難

比PS還好用！Python 20行代碼批量摳圖

python pandas是如何讀取excel表中的sheet的（二）

03.06 Python：40行代碼教你利用Python網絡爬蟲批量抓取小視頻

03.05 Python 配置虛擬環境，讓你的軟件乾乾淨淨…

初學編程：python+java視頻教程兩套限時饋贈給大家

02.27 人生苦短，我用 Python——Life is short, you need Python

為什麼說生活處處都有“Python”

Python 核心知識體系

視頻剪輯什麼鬼？Python 帶你高效創作短視頻

我用 Python 集齊了五福

12.31 Python 2019年值得關注的變化

Python 遠程開機

Numpy：Python，快叫我一聲“爸爸”

Python 線性查找最優實現

Python 如何將字符串作為代碼執行

12.24 Python requests作者簡直是D絲逆襲

Python requests作者簡直是D絲逆襲

相關文章:

PYTHON，幫我命名截圖

Python+scrapy爬蟲識別驗證碼（四）手繪驗證碼識別

用數據一窺如今最流行的編程語言—Python！

基於 Python 的新冠病毒傳播仿真器！

很多推崇學 Python 入行的，如果學完 Python 找不到工作怎麼辦？

Python 爬取b站熱門視頻信息並導入Excel表格

python 函數封閉調用

Python 應該怎樣學？

每天學習倆小時java、Python,前段，你還愁沒工作嗎？

為什麼你現在必須遷移到 Python 3？

Python Excel處理數據之旅-

視頻教程+案例，java、python、前端全套

Python 閒談 15——用Python生成屬於自己的頭條二維碼

Python 進階之遞歸函數一點都不難

比PS還好用！Python 20行代碼批量摳圖

python pandas是如何讀取excel表中的sheet的（二）

03.06 Python：40行代碼教你利用Python網絡爬蟲批量抓取小視頻

03.05 Python 配置虛擬環境，讓你的軟件乾乾淨淨…

初學編程：python+java視頻教程兩套限時饋贈給大家

02.27 人生苦短，我用 Python——Life is short, you need Python

為什麼說生活處處都有“Python”

Python 核心知識體系

視頻剪輯什麼鬼？Python 帶你高效創作短視頻

我用 Python 集齊了五福

12.31 Python 2019年值得關注的變化

Python 遠程開機

Numpy：Python，快叫我一聲“爸爸”

Python 線性查找最優實現

Python 如何將字符串作為代碼執行

12.24 Python requests作者簡直是D絲逆襲

Python requests作者簡直是D絲逆襲

Python：現在還不學習不行啊！

如何零基礎自學 Python？

非常詳細的基礎講解：Python for循環及基礎用法(較長建議收藏）

Python官方最後通牒：Python 2傳奇將在20年落幕，Python 3接力

讓你眼前一亮的 Python 小技巧

Python 基礎入門必看筆記

Python 自動化帶你輕鬆賺錢

Python django搭建環境

python 正確四捨五入的姿勢

python:教你用爬蟲通過代理自動刷網頁的瀏覽量

大數據全棧式開發語言 – Python

python-selenium登陸今日頭條

09.08 Python 熱門開源項目Top10

爲什麼連小學生都要學 Python？

02.26 Python+人工智能月入高達50K？Python 工程師薪資再創新高

小米太無恥了。

蹭熱點！說說我理解的手機包裝盒事件。

蘋果公司正式發佈iPhone SE二代手機

華為河圖、麒麟芯片和鴻蒙OS三駕馬車並行？華為生態建設佈局深遠

小米高管表示，四千毫安時 5G 手機，和三千多毫安時 4G 手機一樣

5G畫風變了：麒麟985落地首跑，榮耀坐上開往高端的「地鐵」

旗艦手機標配Wifi 6 換Wifi 6路由器的時機到了嗎？

2020年5G手機賣不動？繼蘋果砍單25%之後，華為小米紛紛跟砍？

幹翻華為P40系列 榮耀30也玩中

程序員辭互聯網工作，跨行傳統上市公司，上班第1天就蒙了

蘋果發佈新款iPhoneSE，3299元起售

我很糾結：我究竟適不適合做亞馬遜電商？看了這三條你就知道了

請仔細閱讀，關於跨境電商你想知道的都在這兒

騙子手段太“精明”：商家賠了貨物又賠款，亞馬遜平臺騙術大揭祕

做跨境電商這麼多年，今天才知道給國外客戶發文件原來這麼簡單

值得收藏！三類賣家三種選品方案，總有適合你的一個……

萬萬沒想到！亞馬遜平臺上面賣床單竟營收一個億！你還在等什麼？

做店鋪這麼多年，今天才知道我的listing突然被封，竟是因為……

亞馬遜小白看過來！請採納這些：亞馬遜選品和運營的小建議

亞馬遜賣家如何爆單？跨境精細化運營攻略必看

不收保證金、入住費、年費，還免三個月佣金，我也想入駐這個平臺

馬雲終於要辭職了，留下的話句句觸動人心

等等，明年5G手機將迎來大降價

微信公開課PRO版2019正在進行時，往屆各自都有什麼黑科技

推出「信任分」升級「閃購」，美團本地生活這盤棋有多大？

5G我們超越了6G我們也將領先! 美國為什麼會害怕失去5G領導地位呢

界讀｜華為：幫助英國共渡疫情難關，無端批評令英國蒙受損失

為什麼華為今天可以傲視群雄，在世界上立於不敗之地？

血戰「在線辦公」，阿里、騰訊、字節、華為的底牌與大殺器

2020年最強拍照旗艦來了 華為P40系列多項業界首創 香！

今天聊一聊直播

通過直播賺錢不容易，既要豁得出去，又要端得起來

AI和自動化技術聯手，最終會讓60%的工人失去現有的飯碗。

幹翻華為P40系列榮耀30也玩中

2020年最強拍照旗艦來了華為P40系列多項業界首創香！