- 1、本文档共28页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实验四: 主成分分析
理学院 数学实验室 实验四 主成分分析 (Principal Components Analysis) 多元统计分析与统计软件 1、理解主成分分析的方法,掌握主成分分析的实验步骤。 2、利用SPSS软件进行主成分分析,实现简化数据结构的目的。 3、掌握实验命令,对由实验得出的结果进行分析。 实验目的: 利用降维的思想,在损失很少信息的前提下把多个指标转化为几个综合指标的多元统计方法。综合指标是原始变量的线性组合,且互不相关,从而更容易抓住主要矛盾,揭示事物内部变量之间的规律性,属于结构简化类的分析方法。 一、 主成分分析的基本思想 基本思想: 主成分与原始变量之间有如下基本关系: 1.每一个主成分都是各原始变量的线性组合; 2.主成分的数目大大少于原始变量的数目; 3.主成分保留了原始变量绝大多数信息; 4.各主成分之间互不相关. 2. 3. 方程组要求: 1. ,即: 正则条件 正交条件 最大方差条件 二、主成分分析的数学模型及几何解释 1、数学模型 2、几何意义---以二维为例 以二维正态分布样本点来直观说明:如图,设有n个样品点大致分布在平面上一个椭圆内。 坐标旋转公式: Y1轴为第一主成分 Y2轴为第一主成分 1、求解---从协差阵 出发 结论: 的协方差矩阵 的非零特征值 对应的标准化特征向量 分别作为系数向量, 分别称为随机向量的第一主成分、第二主成分、…、第 P主成分. 三、主成分的推导及性质 定义: 称 为第k个主成分 的方差贡献率。 称 为第m个主成分 的累积方差贡献率。 主成分个数的选 取原则: 1、按累积方差贡献率 为原则。 2、选取主成分还可根据特征值的变化来确定, SPSS统计软件 生成的碎石图。 图2 3、在实际应用中有些研究工作者习惯于保留特征值大于1的那些主成分,但这种方法缺乏完善的理论支持。 2、主成分的性质 性质1: F 的协方差阵为对角阵 。即 性质2: 性质3: 因子负荷量的绝对值大小刻画了该主成分的主要意义及其成因. 四、计算步骤 1.根据研究问题选取初始分析变量; 2.根据初始变量特性判断由协方差阵还是由相关阵求主成分; 3.求协差阵或相关阵的特征根 与相应标准特征向量 ; 4.判断是否存在明显的多重共线性,若存在,则回到第一步; 5.得到主成分的表达式并确定主成分个数,选取主成分; 6.结合主成分对研究问题进行分析并深入研究。 特征值 标准正交特征向量 是否有接近0的情况 是 其他处理 否 主成分 对主成分进行分析 深入分析 选择初始变量 度量或取值范围相同? 是 否 (否) 对比 分析相关阵 分析协方差阵 主成分分析逻辑框图 主成分分析的应用条件 原假设:相关系数矩阵为单位矩阵(即变量互不相关)。 备择假设:相关系数矩阵不是单位矩阵 1、Bartlett球形检验 SPSS将提供Bartlett球形检验的卡方统计量的值、相应的自由度和显著性值。如果显著性值小于0.05,则认为主成分分析是适宜的。卡方统计量的值越大,变量之间的相关性越强。 KMO统计量的取值在0和1之间,该值越大,则样本数据越适于作主成分分析和因子分析。 2、KMO统计量---检验样本是否适于作主成分分析 【例】在企业经济效益的评价中,设计的指标往往很多。为了简化系统结构,抓住经济效益评价中的主要问题,我们可由原始数据矩阵出发求主成分。在对我国部分省、市、自治区独立核算的工业企业的经济效益评价中,涉及到9项指标,原始数据见表7-7,即样品数n=28,变量数p=9。 五、SPSS实现过程 * 100固定资产原值实现值(%) 100元固定资产原值实现利税(%) 100元资金实现利税(%) 100元工业总产值实现利税(%) 100元销售收入实现利税(%) 每吨标准煤实现工业产值(元) 每千瓦时电力实现工业产值(元) 全员劳动生产率(元/人.年) 100元流动资金实现产值(元) 北京(1) 119.29 30.98 29.92 25.97 15.48 2178 3.41 21006 296.7 天津(2) 143.98 31.59 30.21 21.94 12.29 2852
您可能关注的文档
最近下载
- 地铁物业管理培训课件.pptx
- 工程数学(本)形成性考核作业4.doc
- GB T 34520.7-2017 连续碳化硅纤维测试方法 第7部分:高温强度保留率 标准.pdf
- 自编教材审核表(模板).pdf
- 一例慢性阻塞性肺疾病急性加重期合并II型呼吸衰竭患者的个案护理PPT.pptx
- [大庆]黑龙江大庆市民政局所属事业单位选调事业编制工作人员笔试上岸试题历年高频考点难、易错点附带答案详解.docx VIP
- ISO9001 14001 ISO45001检查表审核方法全套.docx VIP
- 增光膜规格说明书.pdf
- 人教版数学四年级第一单元教材解读及集体备课课件.pptx VIP
- 2024 离婚协议书 离婚协议(打印版).docx
文档评论(0)