- 1、本文档共14页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
智能决策支持系统案例研究
——基于案例推理(CBR)在医疗领域的应用
【注】:内容源自《CBR-RBR 融合推理模型的构建及在医疗领域的应用》一文,作者:谢涛。
CBR-RBR融合推理诊断模型:
医疗诊断过程:
1
总 览
IDSS处理过程:
1
总 览
获取医疗病案数据,进行预处理。
利用粗糙集理论对医疗病案数据进行特征属性约简。
计算约简后的医疗病案数据的粗糙集属性重要度和信息增益值,综合加权后得到病案特征的权重。
由训练病案数据建立基于 K-D 树的病案库,对测试病案数据进行 CBR 病案检索。
对于相似度较高达到或超过设定的相似度阀值的测试病案,有理由认为病案库中最相似病案与其诊断结果是相同的,可直接将该最相似病案输出供医生诊断,转7;对于相似度较低低于设定的相似度阀值的测试病案,我们无法找到最相似的病案,所以使用 RBR 模块对其进行规则推理,转6。
使用 Bagging-C4.5 决策树集成技术构建 RBR 推理模块,对相似度低于设定阀值的病案进行 RBR 推理诊断。
输出推理结果。
记录推理结果的诊断效果,并将有效的病案推理结果作为新的病案加入病案库,同时更新 RBR 模块的决策树规则。
2
相关理论
CBR
RBR
含义
Case-Based Reasoning,通过源案例指导目标案例求解。以相似度衡量。类似机器学习、神经网络。
Rule-Based Reasoning,通过既定规则指导目标案例求解,规则是人为制定。类似专家系统。
优点
自组织、自学习
知识容易获取
应用广泛,使用门槛低
概况性、一致性
在细分领域有很好的性能
提供推理依据
缺点
案例库难以改写
推理过程无法解释
依赖经验
知识获取瓶颈
无记忆
规则的脆弱性
2
相关理论
属性约简:在案例的特征属性中,存在冗余、无效的特征属性,特征属性约简方法就是要去除这些特征属性。
案例特征权重:在案例推理过程中,需要比较案例之间的相似度。案例中的各个特征属性与案例的关联度、对案例分类的有效性等都有所不同,反映出各特征属性对案例的“优劣”程度的区别。
2
相关理论
案例检索:
基于相似度的检索
CBR 案例检索通常使用基于相似度的方法,从案例库中检索和匹配得到与目标案例最相似的案例。
基于 K-D 树的检索
K-D 树是一种基于案例空间分解的树型数据结构,它拥有同二叉树类似的结构,因而同样具有结构简单、存储和有哪些信誉好的足球投注网站效率高的特点,是一种高效的适用于多维空间的数据索引结构,非常适合用于案例库的案例存储和案例检索。
2
相关理论
推理方法:
基于产生式规则
直接将专家经验与知识转化成“IF-THEN”规则。
多分类器集成
人们在大量的实验中发现,如果将多个分类器的分类结果进行结合,其性能往往比单个分类器更好。集群优化推理注重的是基学习器在组合后的准确性,而非开始时各个基学习器的准确性。
基于决策树
通过对样本数据进行处理,使用归纳算法生成规则,并能够以内部节点和分枝这类树状结构存储和表示规则:ID3、C4.5算法等。
3
系统建模
数据的类型
数据的清理
粗糙集约减
确定特征权重
建立 K-D 树
训练C4.5决策树
组合得到分类器
Johnson算法
信息增益、重要度
3
系统建模
医疗病案数据,按照数据的类型可以分为两类—离散型数据和连续型数据。因后续要使用分类算法,需要将连续数据离散化。
指运用各种手段,提高医疗病案数据的准确性,清除不一致数据,删去冗余数据。
对空值的处理
对噪音数据的处理
对不一致数据的处理
3
系统建模
Johnson算法通过调用一个简单的贪心算法的变种,来求出一个约简结果。这种算法一个自然的倾向是,找到争取找到一个具有最小长度的简单的基本蕴涵。
3
系统建模
信息增益(IG)方法是一种重要的基于信息嫡的案例特征属性评价方法。医疗病案特征属性的信息增益值表示该症状特征存在和不存在情况下所获取到的关于诊断结果信息的平均值,即使用这个症状特征对病案集进行分割而导致的期望嫡的降低。
本方法计算得到的病案特征属性综合权重,既考虑了粗糙集中核属性对于样本分类的重要度,又利用信息增益弥补了粗糙集中非核属性的重要度为的缺陷,从而获得更好的病案特征权重。
经过一树检索后,可以查找到医疗病案库中与待诊断病案最相似的病案。如果该病案的相似度足够高,即满足预设的相似度阀值,则可将此病案作为结果输出。
3
系统建模
以抽取的N个样本作为训练集,以C4.5决策树为基学习器,训练M个决策树。在此基础上应用Bagging算法。
组合多个学习器的最简单方法是通过投票,相当于学习器的线性组合,这种方法也称为线性判断组合。
Bagging是一种典型的投票
文档评论(0)