基于医学人工智能技术的病案首页智能编码研究

基于医学人工智能技术的病案首页智能编码研究

点击上方“中国数字医学”可以订阅哦!

病案首页智能编码的研究背景

病案首页是病历档案中最重要的一页内容,它浓缩了病历档案整体的精华,是医疗信息管理和医疗业务统计的重要资料。病案首页的质量会直接影响DRGs分组的质量和使用后的效果。而病案首页中的诊断编码又是病案信息中的重中之重,其编码的准确性、规范性将极大地影响DRGs分组的结果以及后续各类指标及费用计算。

研究目的随着计算能力的提升,基于深度学习的人工智能技术出现了井喷。人工智能技术在很多的领域里可以模仿人脑进行一定程度的逻辑及非逻辑判断,最终可以实现类似于人类的决策判断。

利用先进的人工智能技术探索在病案首页质量控制问题,尤其是编码纠正、辅助上的可行应用。具体实现目标如下:智能化ICD自动编码对应;多诊断情况下自动判别主要诊断;智能化编码合并及合理费用优化。病案首页数据质控可以使用片面与全面方式分别实现。片面实现方式仅只利用病案首页内的相关数据,利用相关分析方法进行处理分析,最终可以实现病案数据的修正、优化及稽查。全面实现方式在可以获得包括病人电子病历数据、处方数据、检查数据等相关其他信息时可以做出的复杂数据质量评估。

病案首页智能编码模型

应用先进的自然语言处理技术、机器学习技术等基于人工智能算法开发的各类模型,将其应用在以诊断(编码)为主的病案首页数据之上。具体技术架构如图1所示,其包含以下特征。

基于医学人工智能技术的病案首页智能编码研究

图1 病案首页质控框架

整合知识库的自然语言处理文本分析原始出院诊断信息为病案首页中的重要信息来源,而且大多数情况下以自然语言形态出现(即医生手动输入的文字型诊断内容)。同时,国家规范的ICD编码(包含ICD-10以及ICD-9-CM版本),其中的标准诊断书写方式也是基于自然语言。一般情况下医生需要通过自己输入的关键词或完整诊断内容从系统自动化匹配的ICD编码中选择合适的对应编码。然而很多时候医生的书写方式与ICD中的形态完全不同,因而一些情况下通过关键字的搜索无法找到对应的ICD编码。

然而这一问题可以通过知识库积累与自然语言处理算法进行优化。自然语言处理算法可以将医生书写的出院诊断文字进行语义学分析。将其中的核心词,及对应程度、病因、病理、部位、临床表现等的修饰词进行拆分与结构化。因而,不同部分的信息点可以以不同的方式进行分析。例如,标为“开放性右肱骨骨折”的主要诊断,自然语言分析可将其拆分为“开放性” “右” “肱骨””骨折”,分别指代诊断的类别、方位、位置及内容。因而可以对不同部分进行详尽的分析,从ICD编码中找出对应的大类。

进而,医学知识库可以将各类表述同一诊断的不同表述方式进行整理归一,同时也可以将各类医学名词之间的关联性进行细化。例如上例中,可以通过知识库分析得知“右肱骨”属于“肱骨”、“肱骨”位于上臂,因此将会从ICD编码中排除所有不符合的编码,对候选结果进行优化。

机器学习、深度学习模型构建由于编码过程除了涉及医学相关知识外,还要求编码人员有一定的逻辑判断能力。例如可以从多个出院诊断中选择合适的诊断作为主要诊断,或面对多个诊断信息时可以恰当地将其中可以合并的诊断进行编码合并。在此前提下,机器学习、深度学习算法可以对该环节进行一定程度的辅助。

计算语言相似度的方法有很多,依据前期探索的经验,单一方法在自动编码辅助上的效果都偏差。因而需要探索多种方法整合后生成的模型是否可以具备更高的可用性。同时,应用神经网络将各类单一算法中有限的变量整合后进行关联,将可以在原有算法基础上形成新的、可支持一定逻辑的深度学习模型。一些候选的研究算法罗列在表1中。

表1 研究算法

基于医学人工智能技术的病案首页智能编码研究

自学习算法、强误差容忍度为实现主诊断的选择与合并编码,模型应具备极强的自学习能力与抗噪声能力。现有院内编码数据(甚至包括监管部门得到的历年上传的数据)的一个特点就是其中依旧有不少难以发现的错误与偏差。因而,在训练相关的模型时,在无法得到完整的并且无误的训练数据的时候如何保证模型具备一定的误差容忍度就成了极具挑战性的命题。

传播数字医学领域发展最新动态,关注医疗卫生信息化相关资讯。

长按扫码关注我们


分享到:


相關文章: