- 1、本文档共101页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多元线性回归刘桂芬版
多元回归模型的假设 假设1: x1,x2, … xk是非随机的。 假设2:E(?i)=0 i=1,2, …n 假设3:Var(?i)=?2 (E(?i?i)= ?2 ) 假设4:无序列相关, E(?i?j)=0 假设5:x诸变量间无准确的线性关系,即:无多重共线性。数学表示为:不存在一组不全为零的数?1、?2、… ?k,使得: ?1x1i+ ?2x2i+ …+ ?kxki=0 假设6:?i ?N(0, ?2) 1/ 利用判别指标判断影响点: ①SDRESID(学生删除残差):学生删除残差/它的标准误2,该点可能是影响点。 ②COOk距离:一个被认为是影响点的观察值被删除后,其他所有观察值残差的变化。此值越大,表示这个被认为是影响点的观察值的影响力越大。 ③Mahalanobis距离(马氏距离):观察值与自变量平均值之间的距离,用于回归方程中只有一个自变量的情况。距离越大,影响越大。 三、影响分析的指标 ④Leverage Value(中心点杠杆值):其取值范围:0~(N-1)/N。其值越大,越有影响力。等于0,说明此观察值对回归方程无影响;杠杆值为(N-1)/N,说明此观察值对回归方程的贡献很大。理论上希望所有的观察值的杠杆值都接近于p/N(p为方程中自变量的个数)。当杠杆值2p/N时,说明此观察值的影响力很大。 ⑤Covariance Ratio(协方差比):用来衡量某个观察值是否对回归系数具有显著的影响的指标。当此值接近1时,表明此观察值不是影响点。 判断界值:| cov ratio -1| ≥3p/N (可能是) N为观察值的个数。 三、影响分析的指标 2/利用回归系数的变化进一步检验影响点 重点检查某个观察值在与不在回归方程时回归系数的变化情况。 凡前后变化的标准偏回归系数: 差值 (N为观察值的个数),可认定为影响点。 三、影响分析的指标 3/SPSS软件影响点的查找(1) 3/SPSS软件影响点的查找(2) ★在回归分析的对话框中,点击Save,根据需要选择要保存的选项; ★在数据窗中查找已经保存好的参数。或再进行别的分析,如绘制残差图等。 这些指标保存到数据文件中。 残差 预测值 距离 预测值的可信区间 ⑴DfBeta(s): 设从数据中剔除第i条记录前后回归系数之差值。一般大于 就可怀疑为强影响点。 ⑵ Standardized DfBeta(s): DfBeta(s)的标准化值,一般2, 或 就可以怀疑该记录为强影响点。 ⑶DfFit: 某观察值代入包含和不包含该自变量的回归方程所得之差。 ⑷ Standardized DfFit): DfFit的标准化值 以上指标越大,为强影响点的可能性就越大 三、影响分析的指标 ⑸Covariance ratio(协方差比):当此值接近1时,表明此观察值不是影响点。但| cov ratio -1| ≥3p/N 可能是强影响点。 存在强影响点时的处理方法: 1、删除:记录、录入错误;整条记录(不是某个数据)与其它记录明显不同。 2、改模型或对数据进行处理:比如不满足LINE的条件 3、用稳健回归方法(Robust Regression):如加权最小二乘法 4、采用非参数回归(Nonparametric Regression) 三、影响分析的指标 如方程中某些自变量彼此相关,即存在共线性问题。共线性问题会使回归方程迭代结果不稳定,结果不好解释。 四、共线性(collinearity)问题 ★复相关系数的假设检验 与回归方程检验等价。回归方程有统计学意义,复相关系数就有统计学意义。 回归方程检验 ★校正复相关系数(adjusted multiple correlation coefficient, Radj):由于R随自变量个数增多而增大,因此,在比较时需要消除自变量个数的影响。 ★决定系数(determination coefficient),也有称相关指数(correlation index):也即复相关系数的平方。 ★校正决定系数(adjusted determination coefficient):即校正复相关系数的平方。 n为样本含量,p为方程中的自变量个数。 二、偏相关系数 ★零阶相关系数(Zero-Order):所有自变量与因变量、自变量之间的简单相关系数。 ★偏相关系数(Partial Correlation):排除了其他自变量对某自变量xi的影响后,自变量xi与y的相关程度。 偏相关系数大,说明对因变量y的影响大。 回归
文档评论(0)