数理统计数学建模.docVIP

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数理统计 主成分分析 摘要:本文根据问题中的条件和要求,建立了数理统计中的主成分分析模型,运动主成分分析法研究反映每人平均生活消费支出情况的六个指标变量之间的关系。根据所给的数据以生活水平值为因变量,其余变量为自变量,做主成分回归。从而对六维变量空间进行降维处理,提取出两个能够全面反映原有变量所含信息的新指标变量,即主成分。利用原指标与主成分的相关系数即因子载荷,解释了各主成分的意义。并利用第一主成分与第二主成分对16个地区进行分类。如下表所示: 各地区在第一主成分和第二主成分值(标准化后) 地区 北京 天津 河北 山西 第一主成分得分 3.8516 0.7074 -2.0545 -2.1393 第二主成分得分 0.2697 1.2645 1.2167 1.5135 地区 内蒙古 辽宁 吉林 黑龙江 第一主成分得分 -1.2734 0.4404 0.1334 -0.7937 第二主成分得分 1.0283 -0.3943 -1.4876 -0.4944 地区 上海 江苏 浙江 安徽 第一主成分得分 4.4150 0.2664 1.1474 -0.6009 第二主成分得分 0.5354 -0.0011 0.0947 -1.5977 地区 福建 江西 山东 河南 第一主成分得分 -0.6727 -1.3231 -0.3028 -1.8013 第二主成分得分 -1.9125 -1.6677 0.7403 0.8923 【关键字】:主成分分析法 回归 主成分 分类 问题重述 下表1-1是我国16个地区农民在某年支出情况的抽样调查数据的汇总资料,每个地区都调查了反映每人平均生活消费支出情况的六个指标。试对调查资料中的16个地区的农民生活水平进行主成分分析,并利用前两个主成分对16个地区的农民生活水平进行分类。 、表1-1 16个地区的农民生活水平的调查数据 (单位:元) 地区 食品 () 衣着 () 燃料 () 住房 () 生活用品及其它 () 文化生活服务 () 北京 190.33 43.77 9.73 60.54 49.01 9.04 天津 135.20 36.40 10.47 44.16 36.49 3.94 河北 95.21 22.83 9.30 22.44 22.81 2.80 山西 104.78 25.11 6.40 9.89 18.17 3.25 内蒙古 128.41 27.63 8.94 12.58 23.99 3.27 辽宁 145.68 32.83 17.79 27.29 39.09 3.47 吉林 159.37 33.38 18.37 11.81 25.29 5.22 黑龙江 116.22 29.57 13.24 13.76 21.75 6.04 上海 221.11 38.64 12.53 115.65 50.82 5.89 江苏 144.98 29.12 11.67 42.60 27.30 5.74 浙江 169.92 32.75 12.72 47.12 34.35 5.00 安徽 153.11 23.09 15.62 23.54 18.18 6.39 福建 144.92 21.26 16.96 19.52 21.75 6.73 江西 140.54 21.50 17.64 19.19 15.97 4.94 山东 115.84 30.26 12.20 33.61 33.77 3.85 河南 101.18 23.26 8.46 20.20 20.50 4.30 2.模型的假设与符号说明 模型的假设: (1)题中所给的数据真实可靠 (2) 符号说明: :未标准化前的协方差 :各地区六个指标的值。 :各主成分的贡献率。 :前m个主成分的累积贡献率。 :主成分的值。 3问题分析 主成分分析是把各变量之间互相关联的复杂关系进行简化分析的方法。由于多个变量之间往往存在着一定程度的相关性。人们自然希望通过线性组合的方式,从这些指标中尽可能快的提取信息。主成分分析试图在力保数据信息丢失最少的原则下,对这种多变量的截面数据表进行最佳综合简化,也就是说,对高维变量空间进行降维处理。主成分回归是在主成分分析法的基础上,由个自变量选出前个主成分,他们是互不相关的;在保持因变量不变,用这个主成分作为自变量作回归;最后把所得的结果作变量代换,转化成原来因变量与自变量的关系。 第一主成份的推导: 设X的协方差阵为 由于Σx为非负定的对称阵,则有利用线性代数的知识可得,必存在

文档评论(0)

jkf4rty7 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档