GitHub中文趨勢榜第一!「2020新冠肺炎記憶」項目已獲4.9K星標


GitHub中文趨勢榜第一!「2020新冠肺炎記憶」項目已獲4.9K星標

這兩天,又一個關於新冠肺炎的 GitHub 登上了中文趨勢榜的首位,截至目前,已經收穫近 5K Star,600+ Fork。

項目介紹

nCovMemory 項目的中文名稱是「2020新冠肺炎記憶:報道、非虛構與個人敘述」,創立該項目的目的是為研究人士提供方便自然語言處理、疫情防治取用相關資料的資料庫。

資料庫中收錄了 2020 年新型冠狀病毒感染的肺炎相關媒體報道、非虛構作品和親歷者個人敘述。所有的內容均來源於網絡,一個完整的條目從可信的信源收錄內容,包括日期、標題、原始 URL、截圖、archive 等要素,並且暫時不收錄評論、分析、科普等類別的作品。


GitHub中文趨勢榜第一!「2020新冠肺炎記憶」項目已獲4.9K星標


項目的具體結構如下:

<code>├─archive                          文章的存檔,目前提供jpg格式│  └─jpg│    ├─1.jpg│    └─...├─data                             csv格式的文章數據│  └─data.csv├─docs                             一個用於展示README的github page├─gh-page├─template                         README模板│  └─README.handlebars├─utils                            構建README的工具│  ├─generateReadmeFromCsv.js│  └─...└─README.md                        主文檔/<code>

項目意義何在?

毫無疑問,這次的疫情已經成為了一場全民戰爭。從最開始的武漢加油到現在的中國加油,我們不停的討論著疫情的發展。

我們會為在疫情中失去生命的人員痛惜,為醫護人員、抗疫一線人員的奉獻精神所感動;我們會自我隔離、隨時佩戴戴口罩,這些都是我們力所能及的小事兒,但我們每一個人都在為抗疫勝利而努力。

但不管最終結果如何、疫情何時結束,這都是一段在我們心中無法忘卻的歷史,而我們能做的,就是通過記錄完整的事件歷程,通過大數據分析來得出一些相關結論,避免悲劇的再次發生。這也是大數據給我們帶來的價值之一。

我們前幾日推送的文章《 》中,作者用數據分析告訴來我們,控制人口流動對疫情防治的重要性。

而 GitHub 上的這個項目,憑我個人的理解,可以利用 AI 來分析網站、新聞報道和社交媒體中關於新型冠狀肺炎的報道,通過自然語言處理來解析社交媒體上發佈的文本,根據新聞發生的先後順序,來分析真新聞、假新聞,分析事件之間直接或間接的聯繫,從而得出一些結論和歸因。

我相信這些信息對於專業的認識和團隊一定有更多、更大的用途。

對於這次疫情控制工作,相關的信息已經變得越來越透明,我們期待看到更多的好消息和正面消息,但對於事件中那些可能做的不好的地方,我們記錄下來的初心也是為了讓這個國家更好、讓人民更幸福。

「2020新冠肺炎記憶:報道、非虛構與個人敘述」GitHub 項目地址: https://github.com/2019ncovmemory/nCovMemory

更多人在行動

除了「nCovMemory」之外,其實還有很多項目值得我們關注和 Star。我司技術大大 @joyqi 就用公開數據記錄了疫情的發展趨勢,來便於自己和大家從中分析更多有價值的信息:

項目地址:https://github.com/joyqi/ncov2019

許多網友也在做報道、個體敘述、網上輿論的整理和記錄,如:

1.2020 Wuhan Individual Stories

https://github.com/jiayiliujiayi/2020nCov_individual_archives

備份普通人在疫情期間的記錄,主要來自豆瓣,未來可能有所擴增。

2.疫情之下的勞動者——中文媒體報道收集(持續更新)

https://note.youdao.com/ynoteshare1/index.html?id=eee7c8c3d7b8b054dc94d8abd1a211d8&type=note

整理了勞動者們在疫情中的所作所為。按行業編排。

3.疫情與輿情:武漢新冠肺炎時間線TIMELINE

https://github.com/Pratitya/wuhan2020-timeline

記錄自2019年12月起武漢新冠肺炎疫情進展的時間線。以社會學年鑑模式編撰。

4.Academic2019-nCoV

https://github.com/Academic-nCoV/2019-nCoV

每日發佈疫情相關的海外學術、非學術信息。


此次武漢疫情通報所帶來的恐懼,遠比通報本身的內容蔓延得更快。多個城市陸續通報新型冠狀病毒的病例數據,使大家對各種預防方法越來越關注。

但是,很多不正確的預防方法,也在這種時候混淆視聽,甚至使人忽視了正確的應對方法。

SegmentFault 思否 CEO @高陽Sunny:在全民事件面前,雖然我們 SegmentFault 是一個開發者社區,但是每天能覆蓋數百萬開發者的訪問,所以我們覺得有必要整理篩選一些有價值的內容,引起社區開發者的注意,認真且理性的對待和重視,做好防護,保護好自己和家人!在此 SegmentFault 編輯為社區數百萬開發者整理出了關於新型肺炎的防護措施、方法以及最新動態,希望大家不信謠、不傳謠,相信科學,相信醫務人員的努力與奉獻,更為關鍵的是自身養成良好的健康生活習慣,加強鍛鍊、注意身心健康、做好疫情的防護。


GitHub中文趨勢榜第一!「2020新冠肺炎記憶」項目已獲4.9K星標


分享到:


相關文章: