社会统计软件.pptVIP

  1. 1、本文档共81页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
社会统计软件

5. 多元回归分析 a. 变量筛选问题 向前筛选(Forward)策略 解释变量不断进入回归方程。首先,选择与被解释变量具有最高相关系数的变量进入方程,并进行回归方程的各种检验;然后,在剩余的变量中寻找与解释变量偏相关系数最高且通过检验的变量进入回归方程,并对新建立的回归方程进行各种检验;这个过程一直重复,直到再也没有可进入方程的变量为止。 向后筛选(Backward)策略   变量不断剔除出回归方程。首先,所有变量全部引入回归方程,并对回归方程进行各种检验;然后,在回归系数显著性检验不显著的一个或多个变量中,剔除t检验值最小的变量,并重新建立回归方程和进行各种检验;如果新建回归方程中所有变量的回归系数检验都显著,则回归方程建立结束。否则按照上述方法再依次剔除最不显著的变量,直到再也没有可剔除的变量为止。 逐步筛选(Stepwise)策略   是向前筛选和向后筛选策略的综合。向前筛选策略是变量不断进入回归方程的过程,变量一旦进入回归方程就不会被剔除出去。随着变量的不断引入,由于解释变量之间存在一定程度的多重共线性,使得某些已经进入回归方程的解释变量的回归系数不显著,这样造成最终的回归方程可能包含一些不显著的解释变量。逐步筛选法在向前筛选策略的基础之上,结合向后筛选策略,在每个变量进入方程后再次判断是否存在应该剔除出方程的变量。因此,逐步筛选策略在引入变量的每一个阶段都提供了再剔除不显著变量的机会。 b. 变量的多重共线性问题  所谓多重共线性是指解释变量之间存在线性相关关系的现象。  解释变量间高度的多重共线性会给回归方程带来许多影响。如偏回归系数估计困难,偏回归系数的估计方差随解释变量相关性的增大而增大,偏回归系数的置信区间增大,偏回归系数估计值的不稳定性增强,偏回归系数假设检验的结果不显著等。 测度解释变量间多重共线性一般有以下方式: 容忍度Tol[0,1](越接近于0,多重共线性越强) 方差膨胀因子VIF:容忍度的倒数[1,+∞](值越大,多重共线性越强) 特征根和方差比 条件指数 [0,10)多重共线性弱;[10,100)多重共线性较强; [100,+∞),多重共线性严重。 6. 线性回归分析的基本操作 Analyze→Regression→Linear  Enter强行进入;解释变量及变量筛选策略可放置在不同的Block中;选择一个变量作为条件变量放到Selection Variable中,并单击Rule给定一个判断条件;Case Labels指定哪个变量作为样本数据点的标志变量。 7.线性回归分析的应用举例  研究高校人文社科研究中立项课题数受哪些因素影响。解释变量强制进入策略(Enter),并做多重共线性检测。               参考调整判定系数0.924 如果显著性水平为0.05,P值小于显著性水平,应拒绝回归方程显著性检验的零假设,认为各回归系数不同时为0,被解释变量与解释变量全体的线性关系是显著的,可建立线性模型。 各列数据项依次为:偏回归系数、偏回归系数的标准误差、标准化偏回归系数、回归系数显著性检验t值及对应的概率P值、解释变量的容忍度和方差膨胀因子。 若显著性水平为0.05,除投入人年数外,其它变量的P值都大于0.05,它们与被解释变量的线性关系是不显著的,不应该保留在方程中。同时,从容忍度和方差膨胀因子看,多重共线性很严重。因此,需重新建模。 各列依次为:特征根、条件指数、各特征根解释各解释变量的方差比。 从方差比来看,第7个特征根既能解释投入人年数方差的84%,也可解释投入高级职称的人年数方差的98%,同时还可解释专著数方差的44%,因此有理由认为这些变量间存在多重共线性;再从条件指数来看,第5、6、7个条件指数都大于10,说明变量间确实存在多重共线性。 向后筛选策略: 利用向后筛选策略共经过6步完成回归方程的建立,最终模型为第6个模型。随着解释变量的不断减少方程的拟合优度下降了。这说明建立回归方程并不是一味追求高的拟合优度,还要考察解释变量是否对被解释变量有贡献。由于P大于显著性水平0.05,相应的变量都被剔除出方程。最终保留在方程中的变量是投入人年数。方程的DW值是1.747,残差存在一定正自相关。 前5个模型由于都存在回归系数不显著的解释变量,因此这些方程都不可用。第6个模型是最终的方程,(立项课题数)y=-94.524+0.492x(投入人年数),意味着投入人年数每增加一个单位会使立项课题数平均增加0.492个单位。 如在模型3中,剔除专著数的情况下,如果保留投入高级职称的人年数,那么它的标准化回归系数将为-0.439,但回归系数的检验

文档评论(0)

zijingling + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档