网站大量收购独家精品文档,联系QQ:2885784924

医学统计学课件--主成分分析与因子分析(第章).docVIP

医学统计学课件--主成分分析与因子分析(第章).doc

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
医学统计学课件--主成分分析与因子分析(第章).doc

医学统计学课件--主成分分析与因子分析(第20章) Principal Components Analysis amp; Factor Analysis 第二军医大学卫生统计学教研室 张罗漫 第20章 医学统计学 讲课内容: 第一节 主成分分析 第二节 因子分析 医学统计学 第一节 主成分分析 Principal Components Analysis 医学统计学 一、基本思想 数据的降维、数据的解释 将原来众多具有一定相关性的指标,组 合成一组新的相互无关的综合指标。 从中选取几个较少的综合指标尽可能多 的反映原来众多指标的信息。 这种既减少了指标的数目又抓住了主要矛 盾的做法有利于问题的分析和处理。 医学统计学 医学统计学 如何利用这些指标对每一儿童的生长发育 作出正确评价? 仅用单一指标: 结论片面; 没有充分利用原有数据信息。 利用所有指标: 各指标评价的结论可能不一致,使综合 评价困难; 工作量大。 医学统计学 找出几个综合指标(长度、围度、特体),这些综合指标是原始指标的线性组合,既保留了原始指标的信息,且互不相关。 各综合指标提供的“信息”量大小用其方差来衡量。 衡量一个指标的好坏除了正确性与精确性外,还必须能充分反映个体间的变异,一 项指标在个体间的变异越大,提供的信息 量越多。 医学统计学 二、数学模型及几何意义 医学统计学 Z = A X 医学统计学 第一主成分 在所有Zi中最大 医学统计学 第二主成分 …… 理论上主成分个数最多为m个(指标个数) 实际工作中确定的主成分个数总是小于m个 在所有Zi中为第2大。 无关,互相垂直: 医学统计学 X1 X2 1 1 2 -2 -2 -1 -1 2 0 相关 变异 医学统计学 X1 X2 Z1 Z2 1 1 2 -2 -2 -2 -2 1 1 -1 -1 -1 -1 2 2 2 0 医学统计学 Z1 Z2 -2 -2 1 1 -1 -1 2 2 0 相关 变异 医学统计学 三、主成分的求法及性质 医学统计学 (一)主成分的求法 1. 对各原始指标值进行标准化 为了方便,仍用Xij表示Xij’。 医学统计学 标准化后的数据矩阵 X = 医学统计学 2. 求出X1 , X2 , … , Xm 的相关矩阵R R=Cov(X) = 医学统计学 Pearson 相关系数 标准化后的协方差 协方差 医学统计学 3. 求出矩阵R的全部特征值(eigenvalue) ??i, 第i个主成分的组合系数ai1, ai2, ??, aim满 足方程组: (r11- ??i) ai1+ r12 ai2+ ??+ r1m aim =0 r21 ai1+ (r22- ??i) ai2+ ??+ r2m aim=0 ?? rm1 ai1+ rm2 ai2+ ??+ (rmm- ??i) aim =0 医学统计学 (r11- ??i) ai1+ r12 ai2+ ??+ r1m aim =0 r21 ai1+ (r22- ??i) ai2+ ??+ r2m aim=0 ?? rm1 ai1+ rm2 ai2+ ??+ (rmm- ??i) aim =0 ??i为矩阵R的第i个特征值, 共有m个非负特征值,由大到小的顺序排列为: ??1≥ ??2≥ ??≥ ??m≥0 ??i=Var(Zi) 医学统计学 4. 由以上方程组,求出相应于特征值 ??i 的 特征向量(eigenvector) (ai1 , ai2 , ?? , aim)’ 医学统计学 (二)主成分的性质 1.各主成分互不相关 医学统计学 2.主成分的贡献率与累积贡献率 (原始指标值标准化) (指标个数) 贡献率 累积贡献率 医学统计学 3.主成分个数的选取 (1)前k个主成分的累积贡献率gt;70%。 (2)主成分Zi的特征值??i ≥ 1。 4.因子载荷 (第i主成分Zi与第j原始指标Xi间相关系数) 医学统计学 5.样品的主成分得分 医学统计学 四、实例 医学统计学 医学统计学 医学统计学 医学统计学 1.主成分个数的选取 ??3很接近于1; ??3 与??2的贡献率相差不大,为25%左右, 若舍去??3不合理。 取前三个主成分。 医学统计学 2.列出主成分表达式 Z1为急

文档评论(0)

zhangningclb + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档