网站大量收购闲置独家精品文档,联系QQ:2885784924

主成分分析与因子分析-医学统计教学课件.ppt

主成分分析与因子分析-医学统计教学课件.ppt

  1. 1、本文档共68页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
主成分分析与因子分析-医学统计教学课件

2.列出主成分表达式 Z1为急性炎症成分(X1转氨酶、X2肝大指数) Z2为慢性炎症成分(X3硫酸锌浊度 ) Z3为癌变成分(X4甲胎球蛋白 ) 3.求出因子载荷阵 4.主成分得分 标准化指标主成分还原为原始指标主成分 将该肝病患者的四项肝功能指标代入 原始指标主成分表达式: Z1=2.50865 Z2=-1.06626 Z3=-1.22943 该肝病患者可能为急性炎症。 五、主成分分析的应用 1.对原始指标进行综合 以互不相关的较少个综合指标反应众多原 始指标提供的信息。 主成分回归(解决多元共线问题)。 2.进行综合评价 3.进行探索性分析 利用因子载荷阵,找出影响各综合指标的 主要原始指标。 4.对样品进行分类 利用主成分得分对样品进行分类: Z1为急性炎症成分 Z2为慢性炎症成分 Z3为癌变成分 第二节 因子分析 Factor Analysis 一、因子分析基本思想 从分析多个可观测的原始指标的相关关系入手,找到支配这种相关关系的有限个不可 观测的潜在变量。是多元分析中处理降维的 一种统计方法。 如:脑部疾病患者的意识清醒状态可由语言能力、辩识能力、记忆能力、理解能力与 思维逻辑能力等可观测的指标反映。 二、因子分析数学模型 X1:收缩压 X2:舒张压 X3:心跳间隔 X4:呼吸间隔 X5:舌下温度 F1:交感神经 F2:副交感神经 common factor specific factor common factor Xi:观测指标(标准化数据) Fi:公因子 ei:特殊因子 aij:因子载荷(计算关键项) X = AF + e 三、因子模型的性质 矩阵A的统计意义 1.公共度(共性方差 ) 因子的共性方差 2.因子贡献与因子贡献率 矩阵A第j列元素 反映了第j个公 因子Fj对所有原始指标的影响; 数据标准化后全部原始指标的总方差为指 标个数m。 Fj对原始指标的方差贡献率 各因子的贡献 * 主 成 分 分 析 与 因 子 分 析 Principal Components Analysis Factor Analysis 第二军医大学卫生统计学教研室 张罗漫 讲课内容: 第一节 主成分分析 第二节 因子分析 第一节 主成分分析 Principal Components Analysis 一、基本思想 数据的降维、数据的解释 将原来众多具有一定相关性的指标,组 合成一组新的相互无关的综合指标。 从中选取几个较少的综合指标尽可能多 的反映原来众多指标的信息。 这种既减少了指标的数目又抓住了主要矛 盾的做法有利于问题的分析和处理。 如何利用这些指标对每一儿童的生长发育 作出正确评价? 仅用单一指标: 结论片面; 没有充分利用原有数据信息。 利用所有指标: 各指标评价的结论可能不一致,使综合 评价困难; 工作量大。 找出几个综合指标(长度、围度、特体),这些综合指标是原始指标的线性组合,既保留了原始指标的信息,且互不相关。 各综合指标提供的“信息”量大小用其方差来衡量。 衡量一个指标的好坏除了正确性与精确性外,还必须能充分反映个体间的变异,一 项指标在个体间的变异越大,提供的信息 量越多。 二、数学模型及几何意义 Z = A X 第一主成分 在所有Zi中最大 第二主成分 …… 理论上主成分个数最多为m个(指标个数) 实际工作中确定的主成分个数总是小于m个 在所有Zi中为第2大。 无关,互相垂直: X1 X2 1 1 2 -2 -2 -1 -1 2 0 相关 变异 X1 X2 Z1 Z2 1 1 2 -2 -2 -2 -2 1 1 -1 -1 -1 -1 2 2 2 0 Z1 Z2 -2 -2 1 1 -1 -1 2 2 0 相关 变异 三、主成分的求法及性质 (一)主成分的求法 1. 对各原始指标值进行标准化 为了方便,仍用Xij表示Xij’。 标准化后的数据矩阵 X = 2. 求出X1 , X2 , … , Xm 的相关矩阵R R=Cov(X) = Pearson 相关系数 标准化后的协方差 协方差 3. 求出矩阵R的全部特征值(eigenvalue) ?i, 第i个主成分的组合系数ai1, ai2, ?, aim满 足方程组: (r11- ?i) ai1+ r12 ai2+ ?+ r1m aim =0 r21 ai1+ (r

文档评论(0)

hhuiws1482 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:5024214302000003

1亿VIP精品文档

相关文档