- 1、本文档共62页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
摘 要
随着医疗数字化进程的日益推进,医疗系统中电子病历的数据量呈现几何级
增长。医学数量信息作为呈现患者病况的可量化数据,普遍以非结构化的方式广
泛包含在电子病历中。医学信息表述多样且复杂,医学数量信息抽取相关研究比
较缺失,高效且准确地将数量信息从非结构化电子病历中抽取出来,以供后续对
病历数据的进一步分析与挖掘,辅助临床智能决策,成为亟待解决的一个问题。
本课题对中文电子病历中的数量信息抽取方法进行了深入研究,论文的主要研究
内容如下:
1)本文对国内一家三甲医院烧伤科的1359 份中文电子烧伤病历进行系统性
人工标注,设计了针对医学数量信息的抽取方法,包括基于自构建字典的规则方
法和基于数量信息语义角色的模式自动学习方法,此外搭建并实现了一系列典型
的序列标注模型,对中文电子病历进行建模实验,在相同的标注医学数据集上进
行综合横向对比,分析不同抽取方法间的效果差异,为目前中文领域中的医学数
量信息抽取提供了实验数据一致的对比分析研究。
2 )本文提出了一种融合了外部特征的BiLSTM-CRF 医学数量信息识别优化
模型,利用人工整合的烧伤医学词典以最长匹配的方式获取字典特征,结合以数
值为中心取得的位置特征作为模型的外部特征,探究了输入层拼接法和隐藏层拼
接法两种不同的特征融合方式对于模型效果的影响。实验结果显示,融合了外部
特征的模型较基线模型有较大的提升,且利用输入层拼接法进行外部特征融合的
扩展模型在所有模型中表现最优,有效地提升了深度学习模型在医学数据规模普
遍较小的情况下对医学数量信息特点的捕获能力。
3 )对于进一步的实体-数量关联,本文提出了一种基于特征工程的自动关联
方法,通过对文本中句子级别的数量信息结构特征进行抽取,形成包含绝对位置
等特征在内的四类结构特征,利用非参数异常值检测的方法获得基于统计的数值
属性特征,最终通过相关性检验及特征消融的方法对特征集进行筛选,以随机森
林作为分类器实现实体和数量之间的自动关联。通过实验验证,在本文提出的特
征集基础上,所有测试的主流分类器正确率均高于87%,随机森林分类器获得了
最高正确率(95.50% ),证明了本文提出的实体-数量关系自动关联方法的高效
性,解决了基于规则方法所导致的人工成本和低泛化性的问题。最后,本文将关
联后的医学数量信息进行规范的语义表示,形成结构化的医学数量信息。
关键词:医学数量信息,中文电子病历,信息抽取,实体-数量关联,语义表示
I
Abstract
With the development of medical digitalization, the data volume of EMR in
medical system is increasing in a geometric level. As the quantifiable data of patients
condition, medical quantitative information is widely distributed in electronic medical
records in an unstructured way. Due to the complexity of medical information
representation and the absence of research on medical quantitative information
extraction, how to extract quantitative information from unstructured electronic
medical records efficiently and accurately has become an urgent problem. Therefore,
this research focuses on the extraction method of CQI in Chinese EMR, and the main
achievements of th
文档评论(0)