第八章 因子分析和聚类分析.ppt

  1. 1、本文档共54页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第八章 因子分析和聚类分析

第八章 因子分析和聚 类 分 析 第一节 因子分析 一、因子分析简介 (一)因子分析的概念 因子分析是从研究相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。它是多元分析中一种降维和分析、简化数据结构的方法。 (二)因子分析的特点 第一,因子变量的数量远少于原有指标变量的数量; 第二,因子变量并不是原有变量的简单取舍,而是对原有变量的重新组构; 第三,因子变量具有命名解释性。 (三)因子模型的假设 1: m≤p; 2:模型为线性模型; 3:特殊因子之间是相互独立的; 4:公因子与特殊因子之间是相互独立的; 5:各公因子都是均值为0,方差为1的独立正态随机变量。其协方差矩阵为单位矩阵。 (四)因子分析的任务 求出因子模型和因子得分函数中的全部系数,利用旋转后的因子模型并结合具体问题给公因子以恰当的解释,利用因子得分函数样品的因子得分,对样品进行分类或排序。 (六)因子分析的计算步骤 1 将原始数据标准化; 2建立变量或样品的相关(似)系数阵R(Q); 3 求R(Q)的特征值及相应的单位特征向量,根据累计贡献率的要求取前m个特征值及相应的特征向量,写出因子载荷矩阵; 4 对因子载荷矩阵施行方差最大正交旋转; 5 计算因子得分,然后将它们用于各种进一步的分析中。 二、因子分析的微机实现 在SPSS主菜单中选择Analyze→Data Reduction→Factor,可实现因子分析。 1、Factor Analysis主对话框: (1) Variables栏,存放分析变量栏。 (2) Selection Variable选择变量栏,用于限制有特殊值的样本子集的分析,当一个变量进入该栏时,激活右侧的“Value”按钮。 (3) 待“Value”按钮激活后,单击该键,打开Set Value对话框,可在该对话框键入标识参与分析的观测量所具有的该变量值。 2、Descriptives对话框,描述统计量选择项 (l) Statistics 统计量栏 (2) Correlation Matrix相关矩阵栏 3、Extraction 对话框 (l) Method ,因子提取方法选择项 (2) Analyze 栏,指定分析矩阵的选择项。 (3) Display 栏,指定与因子提取有关的输出项。 (4) Extract 栏,控制提取进程和提取结果的选择项。 (5) Maximum iterations for Convergence 参数框,指定因子分析收敛的最大迭代次数。系统默认的最大迭代次数为25。 4、Rotation 对话框 (l) Method 栏选择旋转方法 (2) Display 栏选择有关输出显示 (3) Maximum iterations for Convergence 参数框,指定旋转收敛的最大迭代次数。系统默认值为25。可以在此项后面的矩形框中键入指定值。 5、Scores 对话框,有关因子得分的选择项 (l) Save as variables 复选项,将因子得分作为新变量保存在数据文件中。 (2) Method 栏,指定计算因子得分的方法。 (3) Display factor score coefficient matrix 复选项,选择此项将在输出窗中显示因子得分系数矩阵,是标准化的得分系数。 6、“Options”对话框,有关输出的选择项 (l) Missing Values 栏,选择处理缺失值方法。 (2) Coefficient Display Format 栏,决定载荷系数的显示格式。 第二节 聚类分析 一、聚类分析概述 (一)聚类分析的概念 聚类分析是一种建立分类的多元统计分析方法,它能够将一批样本(或变量)数据根据其诸多特征,按照在性质上的亲疏程度在没有先验知识的情况下进行自动分类,将所有的样品或变量分别聚合到不同的类中,使同一类中的个体有较大的相似性,不同类中的个体差异较大。 所谓“没有先验知识”是指没有事先指定分类标准;所谓“亲疏程度”是指在各变量(特征)取值上的总体差异程度。聚类分析正是基于此实现数据的自动分类的。 (二)聚类分析的几点说明 1、所选择的变量应符合聚类的要求 2、各变量的变量值不应有数量级上的差异 3、个变量间不应有较强的线性相关关系 有两种处理方法:(1)首先进行变量聚类,从每类中选一代表性变量,再进行样品聚类;(2)进行主成分分析或因子分析,降维,使之成为不相关的新变量,再进行样品聚类。 二、层次聚类

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档