淺析新冠病毒如何利用遷徙軌跡攻擊人類

指導老師 | 傅洛伊 王新兵


核心成員 | 鄧程 李琦 趙一民 趙梓淇


導讀


自進入2020年以來,新冠病毒感染的肺炎疫情迅速霸佔了各大社交平臺的熱搜榜。疫情發展到今天,我們經歷了一回最少人次的春運,一次最感人的春晚和一場最特別的無人元宵晚會。新冠病毒給全國帶來了方方面面的影響,也讓舉國人民處在緊張不安之中。


最開始,我們每天醒來的時候看到的是指數增長的確診病例數。在黨中央的領導下,全國人民眾志成城抗擊疫情,現如今已經得到了大幅好轉,看到日漸下降的確診病例和日漸增長的治癒人數。儘管如此,我們依然不能放鬆警惕,而是需要針對前期的病毒擴散進行總結與反思,追溯疫情散播的始末,提取散播過程中的主要特點,助力疫情的後續防控,以做到更好地防範於未然。


依託各省疾控中心發佈的病例數據和各大新聞媒體發佈的確證患者的行蹤路線,上海交通大學Acemap團隊藉助可視化手段以及相關的大數據處理、文本分析和知識圖譜技術進行了確診病例數據、患者行蹤路線以及新聞數據的數據整合建模,構建了一系列數據的可視化圖譜,病例地圖、患者遷徙地圖以及省-市-區-縣患者行蹤圖譜。下面將分別對各類可視化成果進行展示與剖析。


人口的遷徙與病毒的爆發:政策正確性限制了病毒的擴散


對此,我們繪製了病例圖遷徙圖,分別介紹如下:


  • 病例圖

從1月24日起,各省疾控中心群提供公開的病例數據,此圖就是從2020年1月24日記錄到了2月17日。每日的數據更新均是來自各省疾控中心的公開數據。

淺析新冠病毒如何利用遷徙軌跡攻擊人類


  • 遷徙圖

從2020年1月1日百度鷹眼便提供了人口遷徙係數的數據,我們結合人口比例計算出了人口遷移的人流比例,記錄了2020年1月1日到2月17日的人口移動變化。每日更新數據均來自百度鷹眼API。

淺析新冠病毒如何利用遷徙軌跡攻擊人類


在這兩個動圖的對比中我們可以發現,在疫情發展的早期,人口遷徙各省之間從武漢遷出的是維繫在一個相對均衡的水平線上,我們發現從1月21日開始就已經有明顯的人口遷移數目的下降,這比武漢1月23日封城提早了兩天,但是考慮到鍾南山院士在1月20日的採訪中說明了新型冠狀病毒具備人傳人的特性,說明人們還是有相當大的自覺性,公民的公共衛生意識有所體現。以Acemap團隊所在實驗室的很多同學為例,他們大都表達了原本已制定節假日走親訪友以及旅遊的計劃,但在鍾南山開始強調事態的嚴重性之後紛紛取消了原有的出行計劃。


若我們將兩幅圖結合起來進行對比觀察,不難發現,封城在大大減少人口遷徙的同時,也可以將病毒鎖定在當時的位置。雖然這可能帶來一定的經濟社會發展的犧牲,但是在全國範圍內來看,對疫情的控制是非常正確和及時的手段。這也不得不佩服武漢,佩服湖北,這是一個英雄的城市、英雄的省!


各省確診患者行蹤圖譜:每個省市均有自己的總體病例特點


由於湖北內的病例數據量非常龐大,病例數據在短時間內更新自然是一件很難做到準確的事情,於是我們暫時致力於除去湖北省外全國其他各省的患者傳播軌跡上的異同。


我們將各大媒體提供的各省市確證病例的行蹤軌跡數據爬取下來,按照虛擬點映射的方式縮到各省實際的確診病例的數目,同時對每名患者的行蹤路線進行基於LDA的文本主題識別,劃分為探親、聚餐和乘坐交通工具等五個行動,繪製了除湖北省外所有的以及各省的確診患者的行蹤路線圖譜。下圖羅列了其中一部分原始數據。


淺析新冠病毒如何利用遷徙軌跡攻擊人類


基於上述繪製依據,我們首先給出全國範圍內的患者行蹤圖譜,該圖譜是基於全國範圍內(除湖北)的5072份確診病例進行繪製的:


  • 全國(除湖北)患者行蹤路線圖譜


通過這個圖,圖中的點佔有的空間越大,就意味著佔的比重最大,通過這幅圖我們明顯發現密切接觸的帶來的傳染可能性最大。所以如果大家在此期間一直處於宅家模式,沒有與確診病例進行過密切接觸,大可不必在居家過程中產生無故的恐慌。同時,我們發現過年探親帶來的感染比重非常小,說明在回家的列車上面存在傳染源但是比重很小,所以為保證自己不受感染,用距離暫存親情是最好的方式。畢竟,當前形勢下,家人聚餐少一次,親情守護多一點。

淺析新冠病毒如何利用遷徙軌跡攻擊人類


與此同時,我們也分析了各省之間的病毒傳播模態的相似性,並相應繪製了全國除湖北外各省市自治區和特別行政區的病患傳播知識圖譜,由於篇幅的原因,在此不盡數羅列,我們在此挑選了幾個有代表性的:


下面我們看看省與省之間的病患傳播軌跡異同之處。


淺析新冠病毒如何利用遷徙軌跡攻擊人類

廣東:家庭聚集是主要影響

淺析新冠病毒如何利用遷徙軌跡攻擊人類

河南:返鄉與家人團聚是主要原因


我們發現這兩個省都是外來人口大省,廣東是外來務工人員最多的省之一,河南是返鄉務工最多的大省之一,存在著華南和華北地區最大的交通樞紐城市廣州和鄭州。有著非常大的疫情爆發的壓力,但是由於政府的管轄得到,最早宣佈進入一級戒備和相關舉措,除了湧現出很多網紅的村支書,還很好的將人們勸說到了家中,所以家屬感染佔絕大多數。


淺析新冠病毒如何利用遷徙軌跡攻擊人類

黑龍江:哈爾濱是關鍵

淺析新冠病毒如何利用遷徙軌跡攻擊人類

重慶:傳播途徑廣,傳播原因多


這兩個省的圖就可以很明顯看出來,黑龍江省有著比較明顯的患病年齡段,以及大量的病例集中在了哈爾濱市,而重慶沒有特別明顯的傳染途徑,各種傳染方式在重慶比較均衡,這說明兩個省或直轄市的人員流動的特點,重慶市作為西南地區的特大城市,在傳染病的傳播途徑下也是非常複雜的,這給重慶市政府帶來了很多的難題,而黑龍江省則是具備年輕人出來務工的數量佔大數的特點。


按照從1月24日到2月17月日的時序的角度看待這四個省市,我們會發現,隨著時間,各省市都有突然的爆發期,但是在這些省市的有效控制下,還是有著不錯的防控結果。


淺析新冠病毒如何利用遷徙軌跡攻擊人類

廣東

淺析新冠病毒如何利用遷徙軌跡攻擊人類

河南


淺析新冠病毒如何利用遷徙軌跡攻擊人類

黑龍江

淺析新冠病毒如何利用遷徙軌跡攻擊人類

重慶


確診患者遷徙軌跡數據可視化:四通八達的交通加速了病毒的傳播


根據各地衛健委公佈的患者遷徙軌跡信息,我們對信息進行整合,完成了軌跡文本中地名信息的提取。並根據百度地圖API提供的地理編碼功能,實現地名向經緯度的映射,從而根據經緯度得到確診患者在區縣級遷徙的軌跡,從而完成較細粒度的軌跡提取,並得到格式化的軌跡數據。然後我們根據這些數據完成了確診患者遷徙軌跡數據的星雲圖可視分析。

  • 省市區縣一體化確診患者遷徙數據可視化
淺析新冠病毒如何利用遷徙軌跡攻擊人類


上圖包含省份,市,區縣等行政區,以及確診患者節點。省市區縣患者之間通過行政區之間的歸屬關係建立連邊。省與省,市與市,區縣與區縣之間通過確診患者的遷徙數據建立連邊。紅色節點代表省級行政區,綠色節點代表市級行政區,藍色節點代表區縣級行政區,其餘節點代表確診患者。行政區節點的大小與該地區確診患者數目呈正相關,可以發現湖北省處於圖的正中心,且確診人數最多。其中圖的綠色部分展現了患者在不同城市之間的遷徙情況,湖北省的各省市,包括武漢市處於中心位置,這使得大多數的遷徙軌跡均經過這些城市,該類型的軌跡實現了病毒的直接傳播;但是也存在少量軌跡並未與這些城市相連,這些節點分佈在綠色區域的邊緣,這說明病毒完成了間接傳播。例如,西藏自治區的唯一一例患者,其遷徙軌跡並未與武漢市直接相連,而是通過青海省的西寧市進行了疫情的傳播,即完成了病毒的間接傳播。幸運的是,由於武漢及時封城,這些節點所代表的城市並沒有出現大規模病毒爆發,從而有效抑制了病毒的傳播。


下面根據確診患者遷徙數據,將以上大圖拆分成三張省與省,市與市,區縣與區縣之間的確診患者遷徙數據的星雲圖,並進行分析。


省級確診患者遷徙數據可視化:患者人數與省份在星雲圖上與湖北省的距離正相關


淺析新冠病毒如何利用遷徙軌跡攻擊人類

淺析新冠病毒如何利用遷徙軌跡攻擊人類


該圖為基於確診患者遷徙數據繪製的患者省際之間遷徙的星雲圖,非常明顯湖北省處於圖的正中間,其確診患者數目最大;圖的配色採用熱力圖的配色方式,顏色越深,代表確診患者越多;節點的大小與該省確診人數呈正相關,邊的粗細與患者在兩省之間遷徙的軌跡數目正相關,可以發現,確診人數較多的省份與湖北省在圖中的歐氏距離較近,確診人數較少的省份與湖北省在圖中歐氏距離較遠,可以得出與湖北省在星雲圖上越近的省份越容易感染肺炎。


將圖的局部進行放大,我們可以發現廣東省、河南省、山東省、重慶市等省級行政區處在湖北省外最鄰近的一環,且這些省份或直轄市確診人數高於其他省份,並且可以發現這些省份或直轄市與湖北省之間存在較粗的連邊,這說明湖北省與這些省份之間存在較多的患者遷徙,從而導致這些省份疫情的大規模爆發。而處於圖邊緣的節點相比內部節點來說,確診個數較少,且與湖北省直連的邊權重較小,可以得到除湖北省以外的省份對於病毒傳播的加速作用也不容小覷。由此也可以發現在交通運輸高度發達的今天,對於疫情防治,切斷疫情的傳播途徑是多麼重要。


市級確診患者遷徙數據可視化:軌跡多起源於湖北省各市


淺析新冠病毒如何利用遷徙軌跡攻擊人類

淺析新冠病毒如何利用遷徙軌跡攻擊人類


該圖為基於患者遷徙數據繪製的患者城市之間遷徙的星雲圖,非常明顯武漢市處於圖的正中間,其確診患者數目最大;同樣,該圖採用熱力圖的上色方法,顏色越深表示確診人數越多。


在局部放大圖中可以發現,確診人數較多的均為湖北省下屬市與省屬直轄縣,這表現由於這些市級行政機構與武漢存在地理位置上的鄰近,所以導致在並未採取有效防治措施之前,患病者在這些區域的大量遷徙,導致這些城市疫情的大規模爆發。除此之外,我們也發現圖中存在一個遷徙路徑的匯聚點,位於右圖的左下角,這個點代表的城市為山東省濟南市。濟南市為北方各大城市之間重要的交通樞紐,有大量患者的軌跡相交於此。由此可知,若早期對各大交通樞紐城市進行相關疫情排查,防治患者通過交通樞紐向全國遷徙,可有效防治疫情的進一步傳播。


除此之外,亦存在一些並未與湖北省各市直接相連的軌跡,因此在城市之間,對外來人員的全面排查,可有效防止包括湖北省各市以外的其他省市外來人對於疫情的傳播。


縣級確診患者遷徙數據可視化:排查軌跡相交區縣可對預防疫情起到積極意義


淺析新冠病毒如何利用遷徙軌跡攻擊人類

淺析新冠病毒如何利用遷徙軌跡攻擊人類


該圖為基於患者遷徙數據繪製的患者區縣之間遷徙的星雲圖,非常明顯武漢市相應區處於圖的正中間,其確診患者數目最大;同樣,該圖採用熱力圖的上色方法,顏色越深表示確診人數越多。


在局部放大圖中可以發現,確診人數較多的均為武漢市相應區,並且在圖的上部發現少量節點存在大量軌跡相交的現象,可在這些節點相應的縣區,進行相應疫情的排查與管控工作,從而有效切斷病毒的傳播,得到抑制病毒傳播,控制疫情擴散的效果。


區縣級星雲圖能夠為疫情的防治提供較細粒度的參考,在軌跡相交的區縣進行重點監察與防疫,可使得各方面資源利用達到最優程度,大大提高疫情的防治效率,從而有效控制疫情的傳播。


總結


病情無情人有情!新冠病毒感染的肺炎疫情肆虐期間,Acemap成員一面積極配合國家政府號召的居民宅家不外出方針政策,一面卻滿懷家國熱情,希望藉助自己工科領域的一技之長,為病毒防控做些綿薄貢獻。上述疫情軌跡分析正是Acemap團隊成員利用在居家時間,參與到疫情的數據分析中來,我們希望通過數據挖掘的力量,一方面找出疫情的發展趨勢,同時還能夠找到除了湖北省以外傳播的情況,讓我們宅在家裡的同學能夠放心,能夠積極樂觀的面對這場災難。更重要的是,Acemap團隊也希望用這種方式聲援武漢,聲援湖北,他們是我們的英雄,是我們的負重者!


最後也希望藉此機會向社會傳遞正能量,讓我們相信醫學,相信科學,相信黨,相信祖國,一切都會好起來的!


淺析新冠病毒如何利用遷徙軌跡攻擊人類

●探尋 “學術宇宙” | 計算機領域會議和期刊星系結構的全方位揭示

●Acemap研究週報 | ACM學術畫像大揭秘

●從 “霧裡看花”到“豁然開朗” | 由分層加載談超大規模學術地圖結構的揭示

●深趴CNS三大刊,牛文大咖氣質揭秘大放送

另外,歡迎大家關注Acemap的官方知乎號,今日頭條賬號及微博賬號,更快速的獲得最新的信息噢


淺析新冠病毒如何利用遷徙軌跡攻擊人類

淺析新冠病毒如何利用遷徙軌跡攻擊人類


淺析新冠病毒如何利用遷徙軌跡攻擊人類


Acemap|愛思美譜


2.27億篇論文,1.15億學者,24000+期刊會議的學術大數據智庫和可視化學術地圖系統


分享到:


相關文章: