- 1、本文档共21页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三组第十队肿瘤诊断模型.
肿瘤诊断数学模型
第三组-第十队 组员:颜琴、谢飞平、苏林伟
摘要
为解决肿瘤的诊断问题,使数据更加直观,我们先用excel对所给的数据进行统计分析,将患者分为良性与恶性两类。对于问题一,我们建立了多元线性回归模型和Fisher判别模型,建立Fisher判别模型是通过预留20组数据用于模型的检验,最后可知用Fisher判别法的正确率为96%。通过分析肿瘤病灶组织的细胞核显微图像的10个量化特征:细胞核直径,质地,周长,面积,光滑度,紧密度,凹陷度,凹陷点数,对称度,断裂度与该肿瘤的良、恶性的关系,建立这10个量化特征与肿瘤关系的模型,并通过所建立的模型判断69位病患的肿瘤性质。对于问题二,为了得到特征数少而又能很好区分患者的良、恶性的模型,我们通过计算各个指标的相关系数,得出对肿瘤良、恶性影响较大的量化特征,并用这些量化特征建立相应模型用于判断病患的肿瘤性质。为使良性患者与恶性患者的10个量化特征的对比更加直观,我们用matlab作了相应的量化特征的平均值、标准差、最坏值对比图,通过对比图可以粗略判断出10个特征的平均值、标准差、最坏值对肿瘤性质的影响程度的大小,通过对比所建模型的诊断结果与所给数据的良恶性来检验所建立模型的可靠性和准确性。
关键字:穿刺采样分析,量化特征,matlab,Excel,多元线性回归,Fisher判别法.
一、问题的重述:
问题一:肿瘤通过穿刺采样进行分析可以确定其为良性的或为恶性的。医学研究发现肿瘤病灶组织的细胞核显微图像的10个量化特征:细胞核直径,质地,周长,面积,光滑度,紧密度,凹陷度,凹陷点数,对称度,断裂度与该肿瘤的性质有密切的关系。根据已获得的10个量化特征的平均值、标准差和最坏值,建立诊断肿瘤是良性还是恶性的模型,并将所建立的模型用于另外69名已做穿刺采样分析的患者,判断出患者的肿瘤是良性还是恶性的。
问题二:为节省费用,根据所提供的10个量化特征的的平均值,标准差和最坏值与肿瘤的良、恶性相关性情况,得出用部分特征来区分肿瘤是良性还是恶性的模型。
二、问题分析
针对问题一:我们根据所提供的数据,将患者分成良性与恶性两个类别,通过建立多元线性回归模型和Fisher判别模型,预留200组数据用于模型的检验,最后可知用Fisher判别法的正确率为96%。并对所建模型进行检验,最后用所建立的模型来诊断69位患者的肿瘤恶、良性。
针对问题二:在问题一的基础上,我们采用多元线性回归模型来诊断肿瘤的良、恶性。要求确定主要的指标来诊断患者的肿瘤是良性还是恶性的,我们通过计算各个指标的相关系数,剔除相关度较低的特征,用对多元线性回归模型的检验结合剩下的特征量来断定患者的肿瘤恶、良性,并通过良性、恶性肿瘤的15个特征量的对比图来检验所取的特征量是否合理,通过所建模型的检验结果与真实情况的对比来检验模型的可靠性。
三、模型的假设与符号说明
模型假设
1、数据来源真实可靠。
2、肿瘤的良、恶性只与题目中所给的10个量化特征相关,与其他指标无关。
3、题目中所给的10个量化特征对肿瘤的良、恶性影响相互独立。
4、题目中各项指标在测定时带来的误差忽略不计。
符号说明:
1、Xi分别为细胞核直径,质地,周长,面积,光滑度,紧密度,凹陷度,凹陷点数,对称度,断裂度的平均值(i=1,2,3,…)。
2、Ni分别为细胞核直径,质地,周长,面积,光滑度,紧密度,凹陷度,凹陷点数,对称度,断裂度的标准差(i=1,2,3,…)。
3、y为多元线性函数。
4、Bi为多元线性函数的参系数(i=1,2,3,…)。
5、ci为Fisher判别函数第个指标的系数判别函数判别函数的临界值 “恶性”肿瘤患者的数量“良性”肿瘤患者的数量为“良性”肿瘤患者判别函数的均值,为“恶性”肿瘤患者判别函数的均值。
9、表示“良性”肿瘤,有209组数据;表示“恶性”肿瘤,有91组数据。
四、模型的建立与求解
4.1问题一的解答
模型一:
根据所给数据及数据的特点,我们建立多元线性回归模型。多元线性函数:
Bi为参数,将样本数据带入上式中,用matlab软件求的各个参数为:
B=[3.3527 0.2175 -0.0120 -0.0227 -0.0004 -1.3896 4.7071 -1.7276 -1.0372 0.0478 -2.3696 -0.4219 -0.0038 0.0353 0.0004 -15.7300 0.8315 4.1749 -15.7663 -0.7212 4.4496 -0.1937 -0.0021 -0.0006 0.0011 -0.3516 -0.2715 -0.3448 -0.23
文档评论(0)