武漢哪些人可以復工?感染者都接觸了誰?這些問題他們秒回

(人民日報健康客戶端記者 李桂蘭)“武漢哪些人可以復工復產?新增病例都接觸了誰?可能的隱性感染者到底是誰?……”

北京海致網聚的數據工程師們就是幫助管理者回答這些問題的人,武漢封城前,他們緊急馳援武漢,十個人每天處理數上億數據,感染者、密切接觸者數量、活動軌跡、時間節點……“我們的處理以秒計,但因每一條數據背後都是人命,不允許出錯!”海致網聚總裁楊娟介紹道。

武漢哪些人可以復工?感染者都接觸了誰?這些問題他們秒回

海致公司製作的智慧大屏效果圖


武漢封城後500多萬人離開,發燒的人都去了哪兒?如何找到

“真沒想到,我回到武漢,就再也沒離開過,而且一工作就是40多天。”1月20日晚上8點,剛放年假的海致科技數據工程師許珂抵達湖北鄂州的家中,正吃著晚飯時接到了公司的通知。第二天返回武漢。

1月23日上午十點武漢封城,“武漢封城前的人都去哪了?又有哪些是發燒的人?乘坐什麼交通工具?他們都接觸了誰?……”封城之後該怎麼做,如何找到那些感染者、密切接觸者、活動軌跡,就成了迫在眉睫的問題了。

海致科技總裁楊娟打了個比方,人群就像在地上翻滾著的黃豆,感染的人群就像裝在框子裡的黃豆,當框子裡的黃豆撒了出去後,就會跟地上的黃豆混在一起滾動,而無法輕易分辨,封城後,這些豆子就像固定了位置一般,不再在地上隨意滾動,但要找出來也並不容易,如何找出來,找出來後如何採取措施都是需要數據做支撐的。

“拿到了外流人員相關原始數據後,我們利用大數據建模手段,構建了上百個分析模型,有數據真實性的交叉驗證模型,有落地確診病例模型,有外流人員去向查找模型,有密切接觸人員身份落地模型等。然後把這些模型的分析數據推送給一線防疫人員,抓緊去落地核查。可以說一個模型就是一個戰場,每個戰場都關乎生死。”

疫情期間的每一天,大家都關注著疫情動態新聞,比如某一位確診病例的活動軌跡等,大家都會比較關心,他都去過哪兒,他都接觸過誰?這些信息,如果我們是一個人一個人地去問,去排查,肯定是不現實的,“揪出一個人,一條線,大家可能覺得還好,工作量也不是很大,稍微費些時間能梳理清楚,但封城前有500多萬人離開武漢,還有900萬人留在城裡,他們很快就會跟其他人接觸,接觸範圍還在擴大,數據必須儘可能快地處理,人群才能被鎖定,我們的數據處理以秒計。”楊娟介紹說。

截至3月30日24時,全國累計確診病例81518例,累計追蹤到密切接觸者706017人,尚在醫學觀察的密切接觸者19853人。“每一個人的數據每天都在更新,哪個小區的確診了,接觸了誰,誰被隔離觀察了,誰住院了,誰出院了,誰在哪裡隔離觀察……每一個人的狀態都在我們的數據系統裡走著,系統裡走過的數據流,屏幕上流動的數據,都是有生命的。”

武漢哪些人可以復工?感染者都接觸了誰?這些問題他們秒回

受訪者供圖


身份證號碼錯了也能確定其人,整理清洗數據人命關天

疫情之下的數據就是一條條鮮活的生命。“數據的每一次改動,都意味著一個生命的狀態發生了變化,很多時候,在電腦前,數據背後,看著生命從最初的密接人員數據表格一步一步挪到病亡人員表格,心裡也是非常難受的,因為那個‘1’真的不是無足輕重的,是活生生的生命。”楊娟介紹說,他們做了上百個模型,裡面近四成的模型是用來保證數據質量的,畢竟,每一條數據後面都是人命,不能算錯。

工程師許珂家裡有兩位同樣在一線堅守的親屬,父親與大伯都是醫生。“從疫情開始,大伯就在鄂州一線救援。但1月26日開始發熱,確診感染,2月13日很不幸沒能挺過去,離開了我們,同樣被感染的大伯母還在隔離治療中。”疫情之下,我們都息息相關,而我們能做的,是盡最大努力做好本職工作。

“我們最開始接觸到的數據都是各家醫院、社區等系統送過來的登記數據,也就是Excel表,有的還是手工表,有的人的身份證號碼填寫的都是錯的,如何儘快找出來,大數據這個時候就有優勢了。”楊娟介紹,數據是有特點的,比如身份證號碼,每一個數字都有其特殊意義,其實中間有八位數是你的出生年月日。可能你也知道,但是我可能他前幾位錯了,但是我基本上可以通過這個年月日加上你的姓名我們可以根據一組數據中的多個數據特點確定正確的身份證號,也能在跟公安、交通等系統對接後,交叉比對確定其人的活動軌跡,相關接觸人的活動軌跡等。

疫情中成立的防疫指揮部,是由衛健委、醫院、疾控中心、公安、交通、通訊等聯合組成的。防疫指揮部會下發一些數據核查、數據分析的需求,然後由數據工程師們配合相關部門完成後,再把分析結果提供給指揮部,以供決策。

事實上,各級政府部門有上百種數據,存儲總量極為龐大,分散在不同部門,同時各級醫療防疫機構,還擁有大量一手疫情數據的手工表格。“短時間內,我們要接入各個部門的數據,做數據處理、清洗、關聯,形成數據模型。”許珂介紹說,這些冗雜紛繁的數據,要迅速的形成一套高效的數據接入、清洗、處理的機制,轉化為精準的防疫信息,傳遞到防疫指揮部。“我們這裡輸出的數據不能有錯,畢竟,政府要靠這個去做決策,去指導醫院、社區的具體工作。”楊娟介紹道。

“數據流轉機制剛剛建立,模型也都是摸索著做,改動很頻繁,要的也很急。那是疫情爆發的第一階段,需要做很多東西去摸索。”新冠肺炎診療方案試行已到了第七版,我們的統計標準,模型建立原則也都跟著在調整,“每日的數據每日結清,每日的數據中各類關注對象信息都要當日上報。這些原始的一手資料,只能由武漢團隊第一時間進行歸納,相比較其他城市的防疫,武漢的工作量都是乘以百計、千計、甚至萬計、億計。”楊娟這樣介紹這段時間的日常工作。

武漢解封在即,哪些人可以復工復產,還是要大數據說話

“從3月25日零時起,武漢市以外地區解除離鄂通道管控,有序恢復對外交通,離鄂人員憑湖北健康碼‘綠碼’安全有序流動。從4月8日零時起,武漢市解除離漢離鄂通道管控措施,有序恢復對外交通,離漢人員憑湖北健康碼‘綠碼’安全有序流動。”這是湖北省人民政府官網發佈的《湖北省新型冠狀病毒感染肺炎疫情防控指揮部通告》的內容。

“雖說是復工復產在即,但並不是說我們的工作就結束了,相反,我們還是會很忙。”

除了更新每天的感染者、密切接觸者數量、活動軌跡、時間節點等信息外,數據處理師們還得給出:哪些人可以復工復產?復工復產的人都在哪兒上班?這些人的家裡有沒有四類人員?楊娟介紹說:“就比如,復工復產了,人們都會選擇交通工具,比如坐公交車,哪個人體溫上升了,他接觸了誰,我們都必須第一時間從各個部門的數據中找到答案,我們處理數據都是按秒算,畢竟,這會給復工復產留下巨大隱患。”

2月22日,許珂與同行的兩位同事,被安排去構建湖北全省的防疫大數據平臺。“我們會做一些風險預警的模型,及時發現一些可能的發熱患者,或者疑似病例,防止再次擴散。”

“目前,海致網聚公司已經服務了包括湖北、廣東、上海、北京在內的243個省、市、縣疫情防控分析支撐工作。具體來說,我們搭建疑似和密切人員分析名單、醫療收治和返程復工等各類模型兩千餘個,發佈各類分析計算結果數據過億條。”楊娟說,“戰疫”接近尾聲,但尚未結束。


分享到:


相關文章: