破解數據“小”、“差”、“亂”難題,醫渡雲推出胃癌疾病數據庫

近日,國內著名醫學期刊《中華消化外科雜誌》上,發表了一篇述評《胃腸腫瘤醫療大數據庫的機遇與挑戰》的文章。該文由北京大學腫瘤醫院與醫渡雲共同撰寫,圍繞我國醫院普遍存在的數據準確度低、更新速度慢、數據利用率低等共性問題進行了分析。

據文章所言,在腫瘤領域,越來越多的高水平研究建立在上萬病例數據的分析基礎上。從腫瘤發生機制的研究到臨床診斷與治療、預防和監測,都涉及數據收集、管理和分析。因此,高質量的臨床數據是未來精準臨床決策與高水平臨床研究的首要基礎條件。

此外,文章還指出了現階段臨床數據庫的三大現狀:“小”“差”“亂”。“小”指的是很多數據庫規模小、病例數少,數據條目結構少。“差”指的是數據質量差,尤其是我國由於人口流動性大,隨訪數據難以收集,存在數據丟失的情況。“亂”是指數據一致性差,數據庫融合共享可能性低。

因此,如何利用大數據技術,改善國內醫療數據庫“小”“差”“亂”的現狀,成為了科研人員的現實問題。

胃癌疾病數據庫探索

國內知名醫療大數據公司醫渡雲,利用一種新型大數據技術,建立了胃癌疾病數據庫,對科研數據進行質量控制。

首先,醫渡雲與醫院的EMR、LIS、PACS和HIS系統數據對接,篩選診斷為胃癌患者,並通過EMPI、映射、結構化和歸一的技術,對數據進行加工,形成一個疾病數據庫。在這個數據庫中,可對數據進行查看、篩選、管理,也可以對數據進行雙錄核查。

破解数据“小”、“差”、“乱”难题,医渡云推出胃癌疾病数据库

另外,可根據需求納排患者並設置研究項目,按研究要求採集數據。當需要一部分隨訪數據的時候,也可以設置隨訪規則,提醒醫生追蹤患者複診或錄入數據。

同時,醫渡雲疾病數據庫中還有描述性統計、單因素分析、多因素分析、相關分析、生存分析描述性統計等統計功能,可以隨時查看疾病指標的分佈情況、分析患者數據、並初步驗證科研思路。

此外,還可以在臨床數據基礎上,接入基因和生物樣本庫數據,不斷拓展數據庫的寬度,以支撐更多的研究。

胃癌疾病數據庫的三大優勢

總體來看,醫渡雲胃癌疾病數據庫和傳統數據庫相比,具有3大優勢,即

1)NLP後結構化處理能力

2)歸一標準化能力

3)複雜邏輯推理計算能力

1、NLP後結構化處理能力

醫療數據中有很多為大段文本,無法直接進行數據統計和計算,醫渡雲利用自然語言處理技術對文本進行結構化提取,如下圖所示,胃癌疾病數據庫可將手術過程描述和病歷檢查文本進行結構化提取和處理。

破解数据“小”、“差”、“乱”难题,医渡云推出胃癌疾病数据库

2、歸一標準化能力

胃癌疾病數據庫按優先級取值,從診斷名稱/病理結論/手術過程描述/檢查結論(胃鏡/超聲胃鏡/CT)這幾個來源取全部值去重輸出Borrmann分型,並將多種雜亂的分型描述歸一成1~4型共4個分型。

破解数据“小”、“差”、“乱”难题,医渡云推出胃癌疾病数据库

3、複雜邏輯推理計算能力

醫院科室數據情況不一樣,有一些數據在原始數據中也查找不到,醫渡雲疾病數據庫可以通過詳盡的醫學邏輯,深度計算來源於醫院不同生產系統的診療數據,以得出原始數據中未提及的數據,以下為病理分期示例。

破解数据“小”、“差”、“乱”难题,医渡云推出胃癌疾病数据库

胃癌疾病模型標準數據集持續升級中

1.0版本的胃癌疾病數據庫,參考了國內外腫瘤主流的指南和規範,包括但不限於:

  • AJCC TNM分期

  • WHO病理分型

  • LOINC檢驗-觀測指標標識符邏輯命名與編碼系統

  • CTCAE常見不良反應事件評價標準

  • INN國際非專利藥品通用名

  • 指南中的命名/沒有標準的採用專家共識


手術治療和病理部分很多字段的值域標準還參考了:

(Japanese gastric cancer treatment guidelines) (在採用 )

  • 第15版日本胃癌處理規約

(Japanese Classification of Gastric Carcinoma);

目前,胃癌疾病模型標準數據集已升級至2.0版本。在原有模型的基礎上,醫渡雲做了複雜邏輯字段深度加工、納入參考更多的標準規範、數據標準值域完整度等全方面的提升。例,在檢查和治療方面的字段增加參考了最新CSCO胃癌診療指南(2018第1版)。

破解数据“小”、“差”、“乱”难题,医渡云推出胃癌疾病数据库

截至目前,醫渡雲已與國內頂尖專家深度合作共建40餘種疾病模型標準數據集,包括消化腫瘤、呼吸腫瘤、婦科腫瘤、泌尿外科腫瘤、頭頸部腫瘤、血液病、心血管疾病等疾病領域,並在持續擴展和升級中。

其中胃癌領域,醫渡雲除了與北腫合作外,還與中國醫科大學附屬第一醫院、南京鼓樓醫院等醫院的頂尖專家建立了合作。醫渡雲通過不斷的沉澱,希望從技術支持的角度在胃癌數據平臺與更多的專家合作共建,為中國胃癌大數據建設及相關研究和診療規範貢獻力量。

按照行業專家的觀點,隨著我國政策的推動,居民健康、社會保障等數據的應用集成,能更方便地獲取覆蓋居民全生命週期的健康信息。通過和醫院已有數據庫的共享,建設符合我國國情的大數據平臺,能逐步形成具有國際影響力的大型疾病數據庫。未來,醫療機構有望通過醫渡雲的疾病數據庫,建立一個嶄新的健康大數據應用體系。

2019年,新的機遇與挑戰並存!動脈網攜手“深潛者”,專注基層醫療創新“海洋”,如何在廣闊的“深水區”中優勝劣汰,潛的更深?如果您也是基層醫療的“深潛愛好者”,歡迎您報名參與,和我們一起征服基層醫療這片遼闊“大海”!

長按識別圖中二維碼,即刻購票啟程!

文 | 郝雪陽

添加時請註明:姓名-公司-職位

後臺發送關鍵詞即可獲得相關好文

近期推薦

★ 分級診療推行4年,公退民進是趨勢,通過基層醫生看公立與民營機構現狀

★ 【首發】企鵝杏仁集團宣佈完成2.5億美元融資,投後估值超過10億美元

★ “4+7”帶量採購大勢下藥企院外渠道開拓忙,DTP藥房成“香餑餑”

動脈新醫藥

★ 創始人曾負責修美樂等重磅藥物全球臨床開發上市工作,繕思藥業在中美兩地同步推進新藥研發

★ 【公告】天士力生物擬赴港上市,重磅藥品普佑克2018年銷售額已超2.2億

★ 接種者不知情,醫生弄不清,你打的疫苗可能過期了!

★ 默沙東、諾華等大藥企正在密切關注這個領域,醫藥初創公司開始佈局

★ 吉利德斥資10億加速臨床進展,NASH治療首藥志在必得?

★ 科學家已發現無膜細胞器和神經退行性疾病的相關性——探秘無膜細胞器

康復專題

★ 百億級康復器械市場調查,科室收入限制行業發展,設備物聯網化成為重要方向

★ 資本理性還是市場冷門,千億規模的康復行業開始“跑馬圈地”了?

★ 心臟康復中心井噴,患者數量、器械銷售增長迅猛,中國心臟康復發展迎來春天

★ 中國言語康復產業梳理:一二線市場逐漸成熟,頭部企業營收超2億,增速超100%

★ 投資、收購和自建,華邦健康以德國康復醫院為樣板,打造本土的康復醫院

★ 全美最佳康復醫院在研究什麼?中風康復項目最多,國內轉化研究需“大跨步”

★ 中美標杆康復醫院PK,中國標準制定、人才培養尚需完善

★ 康復產業大有可為:中美體量相差35倍,部分民營康復醫院利潤超15%

★ 全美榜首康復醫院的152名研究人員中,生物醫學工程佔主導,高校人才聯動是關鍵

★ 連續28年佔據全美康復醫院榜首,Shirley Ryan AbilityLab有何獨特之處?

聲明:動脈網所刊載內容之知識產權為動脈網及相關權利人專屬所有或持有。文中出現的採訪數據均由受訪者提供並確認。未經許可,禁止進行轉載、摘編、複製及建立鏡像等任何使用。

破解数据“小”、“差”、“乱”难题,医渡云推出胃癌疾病数据库

點擊“閱讀全文”,解鎖更多精彩~


分享到:


相關文章: