网站大量收购闲置独家精品文档,联系QQ:2885784924

第7讲_主成分分析.ppt

  1. 1、本文档共33页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第7讲_主成分分析

7.1 主成分分析 引例:图1是去年一季度公映的30部电影的“观看人数”和“DVD销售量”。 图1 试找出综合人气最高的电影并比较其余电影的综合人气。 主成分分析是为了选出 “综合实力最强”的一种分析方法。 1、在数据方差最大处(分散群跨度最大处)画一条轴。这条轴称为“主成分”。 2、求出各个个体在这条轴上的坐标。主成分上的各个个体的坐标称为“主成分得分”。 一、主成分分析的目的 从原始变量中导出少数几个新的变量(主成分),使新变量尽可能地反映原变量的信息,且新变量间互不相关。 二、主成分分析的数学模型 1、主成分分析的结构 引例:“观影人数”和“DVD销售量”是自变量;“综合人气度”是因变量。 提取的主成分包含了主要信息,不一定会有准确的实际含义。 2、主成分的个数:主成分和自变量个数是相同的。 如果有P个自变量则可求出P个主成分: “综合实力”相当于第一主成分;在主成分分析中,通常只求第一、第二主成分即可。 3、主成分的求解原理 第1主成分:通过数据方差最大处的轴。 第2主成分:同第1 主成分垂直正交;且通过数据方差第2大(仅次于第1主成分)的轴。 第3主成分:同第1主成分和第2主成分垂直正交;且通过数据方差第3大(仅次于第1主成分和第2主成分)处的轴。 4、自变量的数据处理 如果在极其不同的范围内测量变量,或是测量单位不是同量纲的,变量一般应该标准化。 为了将主成分分析中不同自变量中不同的单位统一,自变量的数值将标准化处理后再进行主成分分析。 (SPSS中自动完成) 三、主成分分析的流程 (一)求出主成分和主成分得分。 (二)确认分析结果的精度。 (三)讨论分析结果。 例1:某杂志对10家粉店的“粉”、“配料”和“汤”三个方面做了5个等级的评价,结果见右表。试对10家粉店的米粉进行综合评价。 (数据录入文件 li1.sav) 下面给出具体计算过程及相应的SPSS输出结果 (一)求出主成分和主成分得分。 1、自变量标准化 !SPSS在调用Factor Analyze过程进行分析时,首先会自动对原始变量进行标准化,故输出结果为标准化后的变量。 2、求相关矩阵——求三个自变量间的相关系数 计算结果: 3、 结果解释: (1)最大特征值对应的特征向量为第1主成分的系数;第 n 大特征值对应的特征向量为第 n 大主成分的系数。 (2)“求出通过数据方差最大处的轴”同“求出相关矩阵中最大的特征值所对应的特征向量”是等价的。 4、主成分分析的SPSS实现: 执行【Analyze】/【Data Reduction】/【Factor Analysis】命令 (1)Variables 框:选 u1,u2,u3 ——选入进行分析的原始变量 (2)Descriptives 子对话框: Correlation Matrix 框组:给出一系列变量间的相关性指标及相关检验。 选 Coefficients ——列出所有变量间的相关系数矩阵 选 KMO and Bartlett’s test of sphericity: 主成分分析和因子分析使用的前提条件:各变量间必须有相关性。 该条件的判断方法:专业知识;KMO统计量和Bartlett’s球形检验。 KMO统计量:KMO0.9—效果最佳; KMO0.7—效果尚可; KMO0.6—效果较差; KMO0.5—不适宜做分析 Bartlett’s检验:原假设—自变量间各自独立 (3)Extraction 子对话框: Method 下拉列表:用于选择公因子的提取方法 选 Principal components —主成分分析法 Analyze 单选框组:选择使用变量间的相关系数矩阵还是协方差矩阵进行分析。按系统默认的相关阵即可。 Extract 单选框组:设定主成分的提取标准。 Eigenvalues over :以特征根大于某数值为提取标准。系统默认为1。 Number of factors :自定义提取主成分的数量,在右侧框内填入

文档评论(0)

wyjy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档