网站大量收购闲置独家精品文档,联系QQ:2885784924

多元统计分析46150.ppt

  1. 1、本文档共82页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
该假定和上述关系式构成了正交因子模型。由上述假定可以看出,公共因子彼此不相关且具有单位方差,特殊因子也彼此不相关且和公共因子也不相关。 二、正交因子模型的性质 1. 的协差阵 的分解故得如果 为各分量已标准化了的随机向量,则 就是相关阵,即有 若取,则有分解式此时,没有达到降维目的,故所作的因子分析没有意义。 出于降维的需要,我们常常希望m要比p小得多,这样分解通常只能近似成立,即有近似程度越好,表明因子模型拟合得越佳。一般来说, m选取得越小,上述近似效果就越差,即因子模型拟合得越不理想。拟合得太差的因子模型是没有什么实际意义的。 参数估计 一、主成分法 二、主因子法 三、极大似然法 一、主成分法 因子得分 一、加权最小二乘法 二、回归法 一、加权最小二乘法 采用类似于回归分析中加权最小二乘估计的想法将 估计为在实际应用中,用估计值 、 和 分别代替上述公式中的 、 和 ,并将每个样品的数据代入,便可得到相应的因子得分 二、回归法 在因子模型 中,假设服从元正态分布,用回归预测方法可将估计为在实际应用中,可用 、 和 分别代替上述公式中的 、 和 来得到因子得分。样品 的因子得分 因子分析应用:操作 假设对568医生进行访问调查,向每位医生询问6个有关成本的问题,了解医生对医疗成本的态度 use /data/r11/bg2 describe factor bg2cost1-bg2cost6 主成分的定义及导出 设为一个 维随机向量,,。考虑如下的线性变换希望在约束条件下寻求向量 ,使得达到最大, 就称为第一主成分。 设为 的特征值,为相应的单位特征向量,且相互正交。则可求得第一主成分为它的方差具有最大值 。 如果第一主成分所含信息不够多,还不足以代表原始的 个变量,则需考虑再使用一个综合变量,为使 所含的信息与 不重叠,应要求我们在此条件和约束条件下寻求向量 ,使得达到最大,所求的 称为第二主成分。求得的第二主成分为其方差为 。 一般来说, 的第 主成分是指:在约束条件和下寻求 ,使得达到最大。第 主成分为 主成分的性质 1.主成分向量的协方差矩阵其中,即,且互不相关。 2.主成分的总方差由于故或 总方差中属于第 主成分 (或被 所解释)的比例为称为主成分 的贡献率。 第一主成分 的贡献率最大,表明它解释原始变量的能力最强,而的解释能力依次递减。 主成分分析的目的就是为了减少变量的个数,因而一般是不会使用所有 个主成分的,忽略一些带有较小方差的主成分将不会给总方差带来大的影响。 前 个主成分的贡献率之和称为主成分的累计贡献率,它表明解释的能力。 通常取(相对于 )较小的 ,使得累计贡献达到一个较高的百分比(如80%~90%)。此时, 可用来代替,从而达到降维的目的,而信息的损失却不多。 3.原始变量 与主成分 之间的相关系数 在实际应用中,通常我们只对与的相关系数感兴趣。 从相关阵出发求主成分 样本的主成分 我们可以从协差阵 或相关阵 出发求得主成分。但在实际问题中, 或 一般都是未知的,需要通过样本来进行估计。设数据矩阵为则样本协差阵和样本相关阵分别为 样本的主成分 一、样本主成分的定义 二、从 出发求主成分 三、从 出发求主成分 四、主成分分析的应用 五、若干补充及应用中需注意的问题 一、样本主成分的定义 若向量 在约束条件下,使得的样本方差达到最大,则称线性组合为第一样本主成分。若向量 在约束条件和 的样本协方差下,使得的样本方差达到最大,则称线性组合为第二样本主成分。一般地,若向量 在约束条件和的样本协方差下,使得的样本方差达到最大,则称线性组合为第 样本主成分,。 需要指出的是,样本主成分是使样本方差而非方差达到最大,是使样本协方差而非协方差为零。 主成分得分 在实际应用中,我们常常让 减去 ,使样本数据中心化。这不影响样本协差阵 ,在前面的论述中惟一需要变化的是,将第 主成分改写成中心化的形式,即 若将各观测值 代替上式中的观测值向量 ,则第主成分的值称之为观测值 的第 主成分得分。所有观测值的平均主成分得分 三、从 出发求主成分 设样本相关阵 的 个特征值为,为相应的正交单位特征向量,则第 样本主成分 其中 是各分量经(样本)标准化了的向量,即 令这是 的各分量数据经标准化后的数据向量,将其代替上述样本主成分公式中的 ,即得观测值 在第 主成分上的得分所有观测值的平均主成分

文档评论(0)

xinshengwencai + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:5311233133000002

1亿VIP精品文档

相关文档