网站大量收购闲置独家精品文档,联系QQ:2885784924

电子病历数字对象分类器生成方法以及最终分类器系统发明专利.pdfVIP

电子病历数字对象分类器生成方法以及最终分类器系统发明专利.pdf

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
电子病历数字对象分类器生成方法以及最终分类器系统 技术领域 本发明属于电子病历管理与分析挖掘领域,具体涉及一种电子病历数字对象 分类器生成方法以及最终分类系统。 背景技术 目前,可获得的以计算机可以处理的电子病历数字对象为表象的知识快速增 长,使得人们无法透彻了解并有效利用这大量的信息。如何帮助用户以高效的方 式组织这些知识并找到所需的重点知识是一项富有挑战性的任务,也是电子病历 管理与分析挖掘领域的核心目的。 对知识统计关系的学习已成为电子病历管理与分析挖掘领域的一个重要研 究热点,它在生物信息学、系统生物学、互联网有哪些信誉好的足球投注网站、社会网、似然模型获取与 利用、地理信息系统和自然语言理解等领域,都获得了极高的重视。它是将关系/ 逻辑表示、概率推理机制(不确定性处理)、机器学习和数据挖掘集成在一起,以获 取数据中的似然模型为目的的电子病历管理与分析挖掘方法。统计关系学习中的 统计指采用基于概率论的概率表示和推理机制,关系是指一阶逻辑表示和关系表 示;学习等同于数据挖掘,是指从数据中学得统计关系模型。目前统计关系学习 方法主要有基于Bayesian 网的方法、基于(隐)Markov 模型的方法、基于随机文 法的方法和基于Markov 网的方法等。 本发明的研究利用统计关系学习的方法,实现电子病历管理与分析挖掘中的 知识获取、分类组织、挖掘与特征标注过程。在这些方面现有技术中存在很多研 究成果,大致可以分为监督型、半监督型和无监督型三类。各自都存在一定程度 缺陷:监督型方法为了获得统计关系的参数估计需要大量的训练数据集,这在实 用环境中特别是某些固定行业应用中难以获得,适用性差;半监督型方法会受局 部数据特征分布的影响,导致整体参数估计的偏差,虽然有研究用似然估计的方 法进行改进,但在计算机自动处理该过程时效果仍不明显;无监督型方法需要严 格预定义先验知识列表,如关键字列表等,可扩展性差。因此需要新的对电子病 历数字对象知识进行分类组织管理的方法,用以提高电子病历管理与分析挖掘过 程中,对电子病历数字对象的分类统计关系进行学习和生成的方法,用以实现计 算机可处理的,高效的,可扩展的电子病历管理与分析挖掘过程。 发明内容 针对上述问题,提出一种电子病历数字对象分类方法和系统,针对计算机可 处理的电子病历数字对象知识,进行自动化的分类组织,通过对电子病历数字对 象分类特征的统计关系学习,实现对分类过程适用性和可扩展性的提升。 本发明的技术方案为:一种电子病历数字对象分类器生成方法,具体步骤包 括: (1)获取电子病历数字对象的聚类结果; (2)生成聚类后结果的粗略分类方法,并形成初步分类器; (3)用聚类结果对初步分类器进行参数调整,并形成最终分类器 作为优选,所述步骤(3)中参数调整步骤包括: a、计算对应于所述粗略分类结果的初步分类器的参数估计值; b、利用聚类结果和最大伪似然估计方法对初步分类器参数进行修正,以生 成对应于相应结果的后验概率; c、根据所述后验概率生成所述最终分类器。 进一步地,所述步骤b 中利用最大伪似然估计方法中,利用最大伪似然估计 值代替一般最大似然估计值,并结合一阶逻辑谓词的方法进行参数值的修正。 进一步地,所述步骤a 中的参数估计值是利用训练集获得,训练集是通过如 下过程自动生成的: 1)获取与所述对象集合相关分类的类别名; 2)基于所述的类别名生成相关的关键值; 3)利用所述关键值分类所述对象集合以得到中间分类结果; 4)从所述中间分类结果获得所述训练集。 更进一步地,所述步骤2)中生成所述关键值的步骤还包括: 参考外部知识源对获取的所述类别名进行重新分类; 以及基于经过重新分类的类别名生成所述关键值。 进一步地,所述步骤3)中述得到中间分类结果的步骤包括: 利用所述关键值作为查询项有哪些信誉好的足球投注网站所述对象集合; 将作为有哪些信誉好的足球投注网站结果的命中列表中的对象标注到相应类别中。 进一步地,所述步骤4)中获得所述训练集的步骤包括: 用所述聚类结果调整所述中间分类结果以生成中间分类器; 从所述中间分类器对应的调整后的分类结果中选择生成所述训练集。 进一步地,用所述聚类结果调整所述初步分类结果以生成最终分类器的步骤 中,是以所述训练集作为初始训练集进行迭代分类器学习,从而学习一组中间分 类器,并从所述一组中间分类器中选择一个最有分类器作为所述最终分类器。 本

文档评论(0)

哒哒 + 关注
实名认证
文档贡献者

哒哒

1亿VIP精品文档

相关文档