1,數據獲取
患前信息收集: 需要有比較規範的表格提供給患者填寫,表格的設計要有數據思維便於後期處理,比如填空格式,選擇題題目,並針對不同病症提供不同內容填寫表格,包括該病症可能的病因,患者本人 家屬 病史 近期活動 吃穿住行等等,患者感受
治療過程記錄:醫生診斷,護士操作,監控數據。建議應針對不同病症梳理不同的填寫內容標準,甚至是病房視頻錄像數據,儀器設備數據的存儲上傳,患者感受
有些需長期觀察的,患者離院後還需要持續進行數據採集。
會發現,最重要的是,需要專業醫生與數據人員共同梳理數據採集的表格模板內容。將治療流程梳理清楚,開放設備儀器數據接口。
需要有方便的方式上傳存儲收集的數據,不管是儀器對接還是平臺人工錄入。確保數據有效性。
2,數據存儲
提前梳理數據的分析挖掘方式和目標(重點和難點,同樣需要專業醫師和數據人員的共同哦努力),進行數據倉庫設計,包括各種索引 主鍵 寬表 結構化 非結構化 列式存儲等,存儲的目標首要的是完整 準確 便於後期使用。
3,數據處理
基於以上的存儲設計,對原始數據進行清洗 轉換 存儲。 搭建各種數據處理腳本,定時任務,實時任務紅平臺。
如果有視頻圖像數據,除了圖像識別技術外可能還需要人工標註。
如果有手寫字體,除了文本識別 自然語言處理 還需要人工標註…
還需要有數據檢驗審核,異常處理監控功能。
4,數據分析與挖掘
數據查詢平臺,各種語言引擎,sql, Python, java, R, scala, 等等,當然,此刻依然需要專業醫護人員和數據挖掘算法人員的共同努力。
同時也要意識到
面對這樣的疫情,什麼都是白扯的。
因為
1.病人太多,醫生接待不了,醫院接待能力有限。導致大量病人擁擠,和東京擠地鐵一樣的場面,什麼數據採集能起作用。
2.這是疫情,不是平時感冒發燒,是關乎生命的事,病人、醫生、護士,都是壓力山大。加上第一條問題,做不起來。
3.應該建立日常的聯防聯治機制,包括特殊病例的快速反應機制,全市、全省、甚至全國的聯網防控。再發現異常的第一時間,就能做出反應,給予預警和處理。
閱讀更多 洛鴻0920 的文章