网站大量收购独家精品文档,联系QQ:2885784924

解决动物性状多重共线性的一种方逐步通径分析法.doc

解决动物性状多重共线性的一种方逐步通径分析法.doc

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
解决动物性状多重共线性的一种方逐步通径分析法

解决动物性状多重共线性的一种方 ? ?????????????????????——逐步通径分析法 孙德林 焦骅 冯蕴华 (农业部农经学院 沈阳农业大学) 动物性状多重共线性是指多元回归中自变量间存在着高度相关性。导致自变量与因变量间的回归关系发生改变。失去自变量与因变量间原有的生物学意义。本文选择奶牛 305 天产奶量( y )与最高日产出现天数( X 1 )。最高月产奶量( X 2 )、 90 天产奶量( X 3 )、最高日产奶量( X 4 )及 30 天产奶量( X 5 )六个性状资料。运用通径分析原理与方法阐述动物性状多重共线性的存在及产生的原因。并进行逐步通径分析建立最优回归方程。把引起多重共线性的自变量弃留在回归方程之外。从而达到科学预测之目的。 一、动物性状多重共线性现象 ???? 动物性状多重共线性主要表现在简单回归系数和偏回归系数符号相反。同时表现不合实际的回归系数。下面结合实例加以说明。 ????资料取自辽宁省锦州市种畜场黑白花奶牛产奶记录。对上这六个性状。采用普通最小二乘法建立回归方程。 =-2430.97+31.45X 1-28.23X 2+17.97X 3+484.35X 4-34.48X 5 ????从上述回归方程可以看出:最高日产奶出现天数( X 1 )增加一个单位。 305 天产奶量( y )增辑 3145 单位。即产奶高峰出现越晚。对 305 天产奶量越有利。最高月产奶量( X 2 )增加一个单位。 305 天产奶量( y )减少 28.23 单位。即最高月产对 305 天产奶量有不利的影响。以上两点与实际情况不符。奶牛实践证明。产奶高峰出现越早越好。希望产奶高峰早日到来,最高月产奶量对 305 天产奶量极为有利,必然表现“正”联系。 二、动物性状多重共线性的剖分 根据通径分析原理。我们可以建立如下正规方程组。 根据原始资料可计算变量间两两简单相关系数列表如下。并代上式求解出各通径系数。 各性状相关矩阵表 X 1 X 2 X 3 X 4 X 5 X 6 最高日产出现天数( X 1 ) 1000000 -0.124277 -0.165490 -0.247799 -0.147389 -0.156218 最高月产级量( X 2 ) ? 1000000 0.974023 0.955942 0.868542 0.725604 90 天产奶量( X 3 ) ? ? 1000000 0.948920 0.918385 0.727383 最高日产奶量( X 4 ) ? ? ? 1000000 0.884237 0.688403 30 天产奶量( X 5 ) ? ? ? ? 1000000 0.556947 Py · x 1=0.041534 。 Py · x 2=-0.449499 。 Py · x 3=1.250212 。 Py · x 4=0.620192 。 Py · x 5=-0.725743 。其符号与偏回归系数一致。 我们知道。一个现象原因与结果的关系可以剖分成直接原因与间接原因。即: 所以,必然有: 根据这个原理我们可对上述几个不合理的通径系数其组成加以剖分。 x 1 对 y 的通径系数 Py · x 1=0.041534 的组成。 x 2 对 y 的通径系数 Py · x 2=-0.449449 的组成。 =0.725604-[(-0.124277)×0.041534+0.974023×1.250212+0.955942×0.620192+ 0.868542×(-0.725743)]=-0.449449 ???? 以上剖分可以看出。通径系数(或偏回归系数)受两方面因素影响。一是该自变量与因变量间相关系数的大小。一是该自变量与其他自变量相关系数大小。因此,不能孤立看待一个通径系数。 x 对 y 的通径系数 Py · x 1=0.041534 ,而二者相关系数 rx 1y=-0.156218 。一个是“正”值,一个是“负”值。按照过去通径系数理论分析。 x 1 对 y 的直接作用是“正”值。其实这并不够全面。而且与事实相反。造成“正”值通径系数原因是, x 1 与 x 2 。 x 4 存在负相关。原有 x 1y 相关系数量“负”值再减去一个比自己大的“负”数。必然表现为“正”数。 x 1 与 y 间真实关系一定是“负”的, x 2 对 y 的通径系数 Py · x 2=-0.449449 。而 rx 2y=0.725604 同样是一正一负。这是因为 x 2 与 x 3 、 x 4 耻辱在较高正相关( rx 2x 3=0.974023 。 rx 3x 4=0.955942 )。原 x 2y 相关系数的“正”值减去 1 一个比自己大的“正”值必然出现

文档评论(0)

kaiss + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档