- 1、本文档共9页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
电子病历数字对象分类器生成方法以及最终分类器系统
技术领域
本发明属于电子病历管理与分析挖掘领域,具体涉及一种电子病历数字对象分类器生成方法以及最终分类系统。
背景技术
目前,可获得的以计算机可以处理的电子病历数字对象为表象的知识快速增长,使得人们无法透彻了解并有效利用这大量的信息。如何帮助用户以高效的方式组织这些知识并找到所需的重点知识是一项富有挑战性的任务,也是电子病历管理与分析挖掘领域的核心目的。
对知识统计关系的学习已成为电子病历管理与分析挖掘领域的一个重要研究热点,它在生物信息学、系统生物学、互联网有哪些信誉好的足球投注网站、社会网、似然模型获取与利用、地理信息系统和自然语言理解等领域,都获得了极高的重视。它是将关系/逻辑表示、概率推理机制(不确定性处理)、机器学习和数据挖掘集成在一起,以获取数据中的似然模型为目的的电子病历管理与分析挖掘方法。统计关系学习中的统计指采用基于概率论的概率表示和推理机制,关系是指一阶逻辑表示和关系表示;学习等同于数据挖掘,是指从数据中学得统计关系模型。目前统计关系学习方法主要有基于Bayesian网的方法、基于(隐)Markov模型的方法、基于随机文法的方法和基于Markov网的方法等。
本发明的研究利用统计关系学习的方法,实现电子病历管理与分析挖掘中的知识获取、分类组织、挖掘与特征标注过程。在这些方面现有技术中存在很多研究成果,大致可以分为监督型、半监督型和无监督型三类。各自都存在一定程度缺陷:监督型方法为了获得统计关系的参数估计需要大量的训练数据集,这在实用环境中特别是某些固定行业应用中难以获得,适用性差;半监督型方法会受局部数据特征分布的影响,导致整体参数估计的偏差,虽然有研究用似然估计的方法进行改进,但在计算机自动处理该过程时效果仍不明显;无监督型方法需要严格预定义先验知识列表,如关键字列表等,可扩展性差。因此需要新的对电子病历数字对象知识进行分类组织管理的方法,用以提高电子病历管理与分析挖掘过程中,对电子病历数字对象的分类统计关系进行学习和生成的方法,用以实现计算机可处理的,高效的,可扩展的电子病历管理与分析挖掘过程。
发明内容
针对上述问题,提出一种电子病历数字对象分类方法和系统,针对计算机可处理的电子病历数字对象知识,进行自动化的分类组织,通过对电子病历数字对象分类特征的统计关系学习,实现对分类过程适用性和可扩展性的提升。
本发明的技术方案为:一种电子病历数字对象分类器生成方法,具体步骤包括:
(1)获取电子病历数字对象的聚类结果;
(2)生成聚类后结果的粗略分类方法,并形成初步分类器;
(3)用聚类结果对初步分类器进行参数调整,并形成最终分类器
作为优选,所述步骤(3)中参数调整步骤包括:
a、计算对应于所述粗略分类结果的初步分类器的参数估计值;
b、利用聚类结果和最大伪似然估计方法对初步分类器参数进行修正,以生成对应于相应结果的后验概率;
c、根据所述后验概率生成所述最终分类器。
进一步地,所述步骤b中利用最大伪似然估计方法中,利用最大伪似然估计值代替一般最大似然估计值,并结合一阶逻辑谓词的方法进行参数值的修正。
进一步地,所述步骤a中的参数估计值是利用训练集获得,训练集是通过如下过程自动生成的:
1)获取与所述对象集合相关分类的类别名;
2)基于所述的类别名生成相关的关键值;
3)利用所述关键值分类所述对象集合以得到中间分类结果;
4)从所述中间分类结果获得所述训练集。
更进一步地,所述步骤2)中生成所述关键值的步骤还包括:
参考外部知识源对获取的所述类别名进行重新分类;
以及基于经过重新分类的类别名生成所述关键值。
进一步地,所述步骤3)中述得到中间分类结果的步骤包括:
利用所述关键值作为查询项有哪些信誉好的足球投注网站所述对象集合;
将作为有哪些信誉好的足球投注网站结果的命中列表中的对象标注到相应类别中。
进一步地,所述步骤4)中获得所述训练集的步骤包括:
用所述聚类结果调整所述中间分类结果以生成中间分类器;
从所述中间分类器对应的调整后的分类结果中选择生成所述训练集。
进一步地,用所述聚类结果调整所述初步分类结果以生成最终分类器的步骤中,是以所述训练集作为初始训练集进行迭代分类器学习,从而学习一组中间分类器,并从所述一组中间分类器中选择一个最有分类器作为所述最终分类器。
本发明还包括另一种技术方案:电子病历数字对象最终分类器系统,包括:获取器,用于获取对象集合的聚类结果;
粗略分类装置,用于生成所述对象集合的粗略分类结果以得到粗略分类器;
以及调整装置,用于用所述聚类结果调整所述粗略分类结果以生成最终分类器。
进一步地,所述调整装置包括:
先验概率计算单元,用于计算对应于所述粗略分类结果的先验概率;以及对准单元,利用最大伪似然估计方法和一阶逻辑谓词方法使得所述粗略分类结果与所述聚类结果对准以生成对应于所述对准结果的后验概率,并
文档评论(0)