- 1、本文档共17页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
主成分分析方法在主成分分析方法中的应用
主成分分析与因子分析及SPSS实现(一):原理与方法? (2014-09-08 13:33:57)javascript:;转载▼一、主成分分析(1)问题提出在问题研究中,为了不遗漏和准确起见,往往会面面俱到,取得大量的指标来进行分析。比如为了研究某种疾病的影响因素,我们可能会收集患者的人口学资料、病史、体征、化验检查等等数十项指标。如果将这些指标直接纳入多元统计分析,不仅会使模型变得复杂不稳定,而且还有可能因为变量之间的多重共线性引起较大的误差。有没有一种办法能对信息进行浓缩,减少变量的个数,同时消除多重共线性?这时,主成分分析隆重登场。(2)主成分分析的原理主成分分析的本质是坐标的旋转变换,将原始的n个变量进行重新的线性组合,生成n个新的变量,他们之间互不相关,称为n个“成分”。同时按照方差最大化的原则,保证第一个成分的方差最大,然后依次递减。这n个成分是按照方差从大到小排列的,其中前m个成分可能就包含了原始变量的大部分方差(及变异信息)。那么这m个成分就成为原始变量的“主成分”,他们包含了原始变量的大部分信息。注意得到的主成分不是原始变量筛选后的剩余变量,而是原始变量经过重新组合后的“综合变量”。我们以最简单的二维数据来直观的解释主成分分析的原理。假设现在有两个变量X1、X2,在坐标上画出散点图如下:可见,他们之间存在相关关系,如果我们将坐标轴整体逆时针旋转45°,变成新的坐标系Y1、Y2,如下图:根据坐标变化的原理,我们可以算出:Y1 = sqrt(2)/2 * X1 + sqrt(2)/2 * X2Y2 = sqrt(2)/2 * X1 - sqrt(2)/2 * X2其中sqrt(x)为x的平方根。通过对X1、X2的重新进行线性组合,得到了两个新的变量Y1、Y2。此时,Y1、Y2变得不再相关,而且Y1方向变异(方差)较大,Y2方向的变异(方差)较小,这时我们可以提取Y1作为X1、X2的主成分,参与后续的统计分析,因为它携带了原始变量的大部分信息。至此我们解决了两个问题:降维和消除共线性。对于二维以上的数据,就不能用上面的几何图形直观的表示了,只能通过矩阵变换求解,但是本质思想是一样的。二、因子分析(一)原理和方法:因子分析是主成分分析的扩展。在主成分分析过程中,新变量是原始变量的线性组合,即将多个原始变量经过线性(坐标)变换得到新的变量。因子分析中,是对原始变量间的内在相关结构进行分组,相关性强的分在一组,组间相关性较弱,这样各组变量代表一个基本要素(公共因子)。通过原始变量之间的复杂关系对原始变量进行分解,得到公共因子和特殊因子。将原始变量表示成公共因子的线性组合。其中公共因子是所有原始变量中所共同具有的特征,而特殊因子则是原始变量所特有的部分。因子分析强调对新变量(因子)的实际意义的解释。举个例子:比如在市场调查中我们收集了食品的五项指标(x1-x5):味道、价格、风味、是否快餐、能量,经过因子分析,我们发现了:x1 = 0.02 * z1 + 0.99 * z2 + e1x2 = 0.94 * z1 - 0.01 * z2 + e2x3 = 0.13* z1 + 0.98 * z2 + e3x4 = 0.84 * z1 + 0.42 * z2 + e4x5 = 0.97 * z1 - 0.02 * z2 + e1(以上的数字代表实际为变量间的相关系数,值越大,相关性越大)第一个公因子z1主要与价格、是否快餐、能量有关,代表“价格与营养”第二个公因子z2主要与味道、风味有关,代表“口味”e1-5是特殊因子,是公因子中无法解释的,在分析中一般略去。同时,我们也可以将公因子z1、z2表示成原始变量的线性组合,用于后续分析。(二)使用条件:(1)样本量足够大。通常要求样本量是变量数目的5倍以上,且大于100例。(2)原始变量之间具有相关性。如果变量之间彼此独立,无法使用因子分析。在SPSS中可用KMO检验和Bartlett球形检验来判断。(3)生成的公因子要有实际的意义,必要时可通过因子旋转(坐标变化)来达到。三、主成分分析和因子分析的联系与区别联系:两者都是降维和信息浓缩的方法。生成的新变量均代表了原始变量的大部分信息且互相独立,都可以用于后续的回归分析、判别分析、聚类分析等等。区别:(1)主成分分析是按照方差最大化的方法生成的新变量,强调新变量贡献了多大比例的方差,不关心新变量是否有明确的实际意义。(2)因子分析着重要求新变量具有实际的意义,能解释原始变量间的内在结构。下一篇文章,将介绍主成分分析和因子分析的在SPSS中的实现。主成分分析与因子分析及SPSS实现(二):实例讨论? (2014-09-13 06:34:09)javascript:;转载▼标签:?/?c=blogq=spssby=tagspss?/?c
您可能关注的文档
- 上海大学会计硕士MPACC复试科目_内容.doc
- 上海会计从业继续教育考试2016练习题.doc
- 下城区中小学音乐艺术素养监测主要知识点整理.doc
- 专科《企业管理学》_试卷_答案.doc
- 下水库溢洪道进口~退水隧洞段及消力池段灌浆施工方案.doc
- 专题10西方人文精神的起源及其发展(老师版).doc
- 专利侵权被告案件代理的七大标准动作.doc
- 专题二中国古代经济史(教师).doc
- 世界文学名著书目.doc
- 专题二中国古代经济的发展.doc
- 广州“PEP”24年小学5年级上册第九次英语第2单元测验卷.pdf
- 银川2024年04版小学第六次英语第二单元寒假试卷.pdf
- 武汉2024年小学6年级下册第15次英语第五单元真题试卷.pdf
- 广州2024年01版小学六年级上册J卷英语第3单元期中试卷.doc
- 岳阳2024年04版小学4年级下册第六次英语第1单元暑期作业.doc
- 成都Unit,24年小学4年级第十次英语第五单元自测题.doc
- 厦门2024年10版小学6年级上册第八次英语第1单元综合卷.pdf
- 青岛2024年01版小学六年级第2次英语第四单元期中试卷.pdf
- 武汉2024年08版小学U卷英语第4单元期末试卷.pdf
- “PEP”2024年11版小学6年级上册第八次英语第5单元期中试卷.pdf
最近下载
- 领导班子成员谈心谈话方案.docx VIP
- 2024年人教版五年级上册道德与法治精编知识点.doc
- 养成教育主题班会.ppt
- 通化(2009)1008-VI 时速200公里客货共线铁路隧道内接触悬挂安装图(单线双箱运输,绝缘锚段关节).pdf
- 工商管理大学课程设计民营企业职工培训管理.doc VIP
- 一种电力营销用智慧稽查数字化平台及系统.pdf VIP
- 矿建工程安全监理实施细则.doc
- 会计涉税分录.pdf VIP
- 贵州省黔东南苗族侗族自治州2023-2024学年九年级上学期期末历史试题(含解析).pdf VIP
- 九年级音乐上册第3单元演唱歌唱美丽的家乡全国公开课一等奖百校联赛微课赛课特等奖课件.ppt VIP
文档评论(0)