人口健康中的机器学习:定义“疾病预测”

人口健康中的机器学习:定义“疾病预测”

如何将疾病信息捕获到分析框架中

预测疾病负担对医疗保健意义重大且显而易见。关于AI和ML“预测疾病”的能力有很多讨论的声音。这样一来,“疾病预测”就有了细微的差别。这些类型的索赔需要仔细评估其基本假设和分析代理。

什么是疾病?

在维基百科中,疾病被定义为“......导致活生物体紊乱......不是由于任何外部伤害......疾病通常被解释为与特定症状和体征相关的医学状况”。刚才说的最后一部分,这里是有细微的差别的。

当临床医生做出诊断时,他们依赖各种信息来支持他们的决定:包括患者的行为和症状、实验室值、放射性检查等。结果最终被编入正式的分类系统,如ICD-10 。在疾病最终得到确认之前,可能会有后续测试,第二和第三种意见,但很少有一个决定因素。

人口健康中的机器学习:定义“疾病预测”

另一方面,机器学习模型通常需要特定的端点来预测(用于监督学习),并始终需要相关和全面的信息(用于监督学习和无监督学习)。例如,一个模型可以估计一个异常实验室值的概率。图像识别在医学成像中非常流行。这些类型的结果是疾病状态的指标,有时是强烈的,但单独与结果临床确认的信息主体不相同。这意味着,当一个模型“预测疾病”时,它不一定是我们认为的,是常见意义上的疾病。

另一方面,那些声称为临床决定建模的人(例如,在医疗索赔中存在ICD-10码)也不一定是分析准确的病情状态。例如,审查制度(由于缺乏信息而导致疾病发生与意识之间存在差异)以及疾病严重程度和复杂程度的差异是这种方法中混杂的问题。这种方法类似于临床试验中的复合终点,其中“结果”可以是预定义的状态或事件的组合。这会在确定的人群中产生异质性,进而破坏预测的质量。

尽管如此,这并不意味着预测临床结果和疾病状态是没有用的,但需要仔细考虑将临床信息适当地抽象为分析过程。

如何成功

你能做些什么来确保建模练习的成功?这里提供几种策略可以使这种训练成功:

1)找出你想要建模的东西

“弄明白它”,这听起来很容易,但一直在很多情况下,客户不清楚他们能在试图摆脱建模过程中得到什么。特别是对于复杂、变化多样的疾病,用户需要清楚自己想要做什么。

2)了解你的局限性

人口健康中的机器学习:定义“疾病预测”

3)选择正确的方法

有很多方法可以捕捉和预测疾病状况。主流的机器学习范式倾向于关注一些简单的回归或分类方法,这些方法由复杂的编程程序支持,但也有其他的很多方法可用。下面是列举的一些流行的例子/案例研究。

  • 深度学习检测糖尿病视网膜病变

  • 利用纵向数据的聚类方法识别疾病的轨迹

  • 使用生存分析确定预期的死亡时间和癌症的主要阶段

可以再想想你自己的问题,然后做做自己的研究。


分享到:


相關文章: