主成分分析法().doc

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
主成分分析法()

19.主成分分析法 (1) 其中, i=1,...,p 用数据矩阵X的p个向量(即p个指标向量)X1,...,Xp作线形组合(即综合指标向量)为: (2) 简写成 i=1,...,p (3) (注意:Xi是n维向量,所以Fi也是n维向量。) 上述方程要求: i=1,...,p (4) 且系数aij由下列原则决定: (1)Fi与Fj(i≠j,i,j=1,…,p)…,Fp是与其他都不相关的X1,...,Xp的一切线性组合中方差最大的。 二、实证模型 实证模型中,我们运用主成分分析的方法,建立我国蔬菜总产的主成分回归预测模型。我们确立了以下13个因素: 蔬菜种植面积(103hm2),记为X1;物质费用(元/ hm2) ,以每公顷每年投入物质费用总金额表示,记为X2;劳动投入(日/ hm2) , 以每hm2 每年投入劳动标准工作日表示,记为X3;蔬菜零售物价指数(1990年=100),记为X4;成本纯收益率(%) ,记为X5;市场化程度(元/人),以人均年社会消费品零售额表示,记为X6 ;城市化水平1(%),用城市人口所占全国人口比重表示,记为X7 ;城市化水平2 (%),用全国从事第二、三产业人口占全国人口比重表示,记为X8;交通(t/人),用每年人均货物运输量表示,记为X9,城镇居民人均可支配收入(元),记为X10,农村居民人均纯收入(元),记为X11,农业劳动力受教育程度(年), 用农民家庭劳动力的平均文化程度表示, 记为X12;气候条件(%),用每年成灾面积占农作物播种面积比重表示,记为X13 。 使用软件: 采用Eviews5.1、SPSS12.0、Stata5.1、SAS 8.1 等计量软件均可完成上述因子分子模型。 三、一个简单的例证:我国蔬菜总产的主成分回归模型 为了弄清13个因素之间的相关关系,我们利用SAS8.1软件将影响我国蔬菜总产的13个因素变量作了共线诊断。我们发现, 从第5 维开始条件指数开始超过30 ,第14 维条件指数竟达到3680430 ,这表示13个影响因素之间存在着严重的多重共线性, 而且X1 与X6、X7、X10、X12, X2以及X4 与X8 、X11等有很强的相关性。由于讨论的是多个因素对蔬菜总产的影响,多个因素之间相关系数又是错综复杂的,任何两个因素之间都有简单的线性关系,而这种相关关系还夹杂了其它变量所带来的影响。因此,现在就需要有一种进行简化的方法,可以在不损失或很少损失原有信息的前提下,将上述若干个个数较多而且彼此相关的因素转化为新的且个数较少并且彼此独立或不相关的综合因素, 然后将这些因素作为解释变量, 与被解释变量蔬菜总产一起, 建立回归模型。 首先,将影响我国蔬菜总产因素的数据写成矩阵形式: X = [ X1, X2 , …, X13 ],Xi 为13维列向量( i= 1,2 ,…,13) 。为了消除原来各指标的量纲,使各指标之间具有可比性, 需对原数据作标准化处理得到标准化矩阵Y=[Y1 ,Y2 ,… , Y13]。计算其列向量相关系数矩阵R=[ rij ]13 ×13 (i,j = 1 , 2 , …, 13),其中rij是第i个指标与第j 个指标之间的样本相关系数, 并进一步由R 的特征方程︱R - λI13 ︱= 0 计算出其特征值λi ( i = 1 , 2 , …, 13)(表1 只给出了R 的前3 个特征值) 。由于第一、第二、第三主成分Z1 、Z2 、Z3 累计解释方差的比率已经超过了94 % , 所以只需求λ1 、λ2 、λ3 所对应的正交化特征向量αi( i = 1 , 2 , 3) 以及模型(*)。计算结果见表1。 表1 相关矩阵的特征值 特征值序号 特征值λ 累计方差比率 特征向量 模型(*) 1 10.163 0.782 α1 Z1=α1YT 2 1.250 0.878 α2 Z2=α2YT 3 0.879 0.946 α3 Z3=α3YT 表1 中: α1 = (0131, 0129, - 0125, 0130, - 0109, 0131, 0130,0130, 0130, 0131, 0131, 0131, 0113) , α2 = ( - 0103, 0123, 0151, 0111, 0177, 0101, - 0109,0113, 0119, 0107, 0104, - 0103, - 0109) , α3 = (0103, - 0103, 0124, - 0108, 0101, - 0103, 0102,- 0106, - 0104, - 0103, - 0108, 0105, 0196) 其次,利用公式r(Zk,Yj) = (其中k = 1, 2,

文档评论(0)

1444168621 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档