网站大量收购闲置独家精品文档,联系QQ:2885784924

临床医学大数据分析与挖掘—基于Python的机器学习与临床决策 第8章 中医证型关联规则分析.ppt

临床医学大数据分析与挖掘—基于Python的机器学习与临床决策 第8章 中医证型关联规则分析.ppt

  1. 1、本文档共28页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据,成就未来 * 大数据挖掘专家 * 大数据挖掘专家 大数据,成就未来 第8章 中医证型关联规则分析 * 1 数据准备 目录 目标分析 2 特征工程 3 模型训练 4 性能度量 5 中医药治疗乳腺癌有着广泛的适应证和独特的优势。从整体出发,调整机体气血、阴阳、脏腑功能的平衡,根据不同的临床证候进行辨证论治。确定“先证而治”的方向:即后续证侯尚未出现之前,需要截断恶化病情的哪些后续证侯。 找出中医症状间的关联关系和诸多症状间的规律性,并且依据规则分析病因、预测病情发展以及为未来临床诊治提供有效借鉴。能够帮助乳腺癌患者手术后体质的恢复、生存质量的改善,有利于提高患者的生存机率。 背景 传统方法存在的缺陷 目前,中医治疗一般都是采用中医辨证的原则,结合临床医师的从医经验和医学指南进行诊断,然而此方法也存在一定的缺陷,如图所示。 背景 一:中医辨证极为灵活,虽能够处理患者的复杂多变的临床症状,体现出治疗优势。但缺乏统一的规范,难以做到诊断的标准化。 二:疾病的复杂性和体质的差异性,造成病人大多是多种证素兼夹复合。临床医师可能会被自身的经验所误导,单纯对症治疗,违背了中医辨证论治的原则。 三:同一种疾病的辨证分型,往往都有不同见解,面对临床症状不典型的患者,初学者很难判断。 患者信息属性说明,,针对患者的信息,对每个属性进行相应说明,如图所示。 数据说明 患者病理信息,包含患者的基本信息以及病理症状等,如图所示。 数据说明 分析流程 分析目标 中医证型关联规则分析主要包括以下步骤。 以问卷调查的方式对数据进行收集,并将问卷信息整理成原始数据。 对原始数据集进行数据预处理,包括数据清洗、特征选择和特征变换。 利用步骤2形成的建模数据,采用关联规则算法,调整模型输入参数,获取各中医证素与乳腺癌TNM分期之间的关系。 结合实际业务,对模型结果进行分析,且将模型结果应用实际业务中,最后输出关联规则结果。 分析目标 1 数据准备 目录 目标分析 2 特征工程 3 模型训练 4 性能度量 5 采用调查问卷的形式对数据进行搜集,数据获取的具体过程如下。 拟定调查问卷表并形成原始指标表。 定义纳入标准与排除标准。 将收集回来的问卷表整理成原始数据。 而问卷调查需要满足如下条件。 问卷信息采集者均要求有中医诊断学基础,能准确识别病人的舌苔脉象,用通俗的语言解释医学术语,并确保患者信息填写准确。 问卷调查对象必须是三阴乳腺癌患者。本案例的调查对象是某省中医院以及肿瘤医院等各大医院各病程阶段1253位三阴乳腺癌患者。 数据获取 拟定调查问卷表并形成原始指标表,如图所示。 数据获取 定义纳入标准与排除标准,如表所示。 数据获取 标准 详细信息 纳入标准 (1)病理诊断为乳腺癌。 (2)病历完整,能提供既往接受检查、治疗等相关信息,包括发病年龄、月经状态、原发肿瘤大小、区域淋巴结状态、组织学类型、组织学分级、P53表达、VEGF表达等,作为临床病理及肿瘤生物学的特征指标。 (3)没有精神类疾病,能自主回答问卷调查者。 排除标准 (1)本研究中临床、病理、肿瘤生物学指标不齐全者。 (2)存在第二肿瘤(非乳腺癌转移)。 (3)精神病患者或不能自主回答问卷调查者。 (4)不愿意参加本次调查者或中途退出本次调查者。 (5)填写的资料无法根据诊疗标准进行分析者。 将收集回来的问卷表整理成的部分数据,如图所示。 数据获取 收回的问卷中,存在无效的问卷,为了便于模型分析,需要对其进行清洗处理。问卷调查根据纳入标准与排除标准的有效性条件筛选后,数据量变化情况如图所示。 数据清洗 1 数据准备 目录 目标分析 2 特征工程 3 模型训练 4 性能度量 5 删除不相关特征,选取其中六种证型得分和TNM分期属性,部分数据如表所示。 特征选择 患者编号 肝气郁结证得分 热毒蕴结证得分 冲任失调证得分 气血两虚证得分 脾胃虚弱证得分 肝肾阴虚证得分 TNM分期2 20 12 15 5 13 H420 4 12 14 5 11 H44 0 8 6 1 6 H413 9 13 6 8 12 H410 12 5 9 8 13 H4 为了更好的反应出中医证素分布的特征,采用证型系数代替具体单证型的证素得分,证型相关系数计算公式为:证型系数 = 该证型得分/该证型总分。特征构造结果部分数据如表所示。 特征变换 1. 特征构造 患者编号 肝气郁结证型系数 热毒蕴结证型系数 冲任失调证型系数 气血两虚证型系数 脾胃虚弱证型系数 肝肾阴虚证型系数 TNM分期0.050 0.454545 0.292683 0.348837 0.116

您可能关注的文档

文档评论(0)

dllkxy + 关注
实名认证
内容提供者

本文库主要涉及建筑、教育等资料,有问题可以联系解决哦

版权声明书
用户编号:5213302032000001

1亿VIP精品文档

相关文档