- 1、本文档共99页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
原始的6个变量与两个因子的关系(模型表达) 因子分析(实例分析) 因子分析的数学模型 表达式中的xi已经不是原始变量,而是标准化变量 ? 旋转后的因子载荷图 因子分析 (实例分析) 旋转后的因子载荷系数更加接近于1(如果旋转后的因子载荷系数向0—1分化越明显,说明旋转的效果越好),从而使因子的意义更加清楚了 ? 按回归法(Regression)估计的因子得分系数矩阵 因子分析 (实例分析) 因子得分系数矩阵 根据因子得分系数矩阵可将因子表示为变量的线性组合 由因子得分系数矩阵,可以将公因子表示为各变量的线性组合。得到的因子得分函数为 因子分析 (实例分析) 上面表达式中的xi标准化变量。根据这一表达式便可以计算每个地区对应的第一个因子和第二个因子的取值,也称为因子得分(factor score)。有了因子得分,就可以对每个地区分别按照前面命名的“经济水平”因子和“消费水平”因子进行评价和排序 因子得分函数 ? 综合评价 计算每个地区的因子得分 每个地区的因子得分计算方法是:用每个共因子的方差贡献率做权数,对每个因子进行加权,然后加总得到每个地区的总因子得分 按总得分的多少进行排序,以反映各地区经济发展的差异 因子分析 (实例分析) 要由SPSS得出各样本的不同因子得分,点击【Scores】?【Save as variables】即可。SPSS会计算出每个因子的得分,并保存在工作表的FAC1_1和FAC2_1中 因子综合得分 ? 各地区的因子得分及排名 因子分析 (实例分析) ? 地区两个因子得分的散点图 因子分析 (实例分析) 因子1得分最高的是广东,最低的西藏,这说明广东是经济发展水平较高的地区,西藏是经济发展水平较低的地区;因子2得分最高的是上海,最低的是贵州,说明上海是消费水平较高的地区,而贵州则是消费水平较低的地区 主成分分析和因子分析都是多元分析中处理降维的两种统计方法。只有当原始数据中的变量之间具有较强的相关关系时,降维的效果才会明显,否则不适合进行主成分分析和因子分析 主成分和因子的选择标准应结合具体问题而定。在某种程度上取决于研究者的知识和经验,而不是方法本身 即使得到了满意的主成分或因子,在运用它们对实际问题进行评价、排序等分析时,仍然要保持谨慎,因为主成分和因子毕竟是高度抽象的量,无论如何,它们的含义都不如原始变量清晰 因子分析可以看作是主成分分析的推广和扩展,而主成分分析则可以看作是因子分析的一个特例。目前因子分析在实际中被广泛应用,而主成分分析通常只作为大型统计分析的中间步骤,几乎不再单独使用 几点说明 因子分析的作用和目的 数据降维 指示成因推理方向 分解迭加的过程 形成科学的假设 检验已有的模式 结 束 139 //增加模型的实例,使用更通俗的例子 * 按照面积的差异进行分组,对不同的指标进行均值相等检验。 * 数据中存在相关,是由于存在一个共同的影响-过程。 如何利用这种相关信息,来推测过程呢? 数学上的处理是将原始的p个变量作线性组合,作为新的变量 设p个原始变量为 ,新的变量(即主成分)为 ,主成分和原始变量之间的关系表示为 主成分分析的数学模型 主成分分析的数学模型 aij为第i个主成分yi和原来的第j个变量xj之间的线性相关系数,称为载荷(loading)。比如,a11表示第1主成分和原来的第1个变量之间的相关系数,a21表示第2主成分和原来的第1个变量之间的相关系数 选择几个主成分?选择标准是什么? 被选的主成分所代表的主轴的长度之和占了主轴总程度之和的大部分 在统计上,主成分所代表的原始变量的信息用其方差来表示。因此,所选择的第一个主成分是所有主成分中的方差最大者,即Var(yi)最大 如果第一个主成分不足以代表原来的个变量,在考虑选择第二个主成分,依次类推 这些主成分互不相关,且方差递减 主成分的选择 究竟选择几个主成分才合适呢? 一般要求所选主成分的方差总和占全部方差的80%以上就可以了。当然,这只是一个大体标准,具体选择几个要看实际情况 如果原来的变量之间的相关程度高,降维的效果就会好一些,所选的主成分就会少一些,如果原来的变量之间本身就不怎么相关,降维的效果自然就不好 不相关的变量就只能自己代表自己了 主成分的选择 对原来的p个指标进行标准化,以消除变量在水平和量纲上的影响 根据标准化后的数据矩阵求出相关系数矩阵 求出协方差矩阵的特征根和特征向量 确定主成分,并对各主成分所包含的信息给予适当的解释 主成分分析的步骤 【例】根据31个省市自治区2006年的6项主要经济指标数据,进行主成分分析,找出主成分并进行适当的
文档评论(0)