建立回归模型之二诊断.PPT

  1. 1、本文档共47页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
建立回归模型之二诊断

10.1 單一預測變數之模型適當性:追加變數圖 我們若是對於迴歸模型中已經存在變數X2時,新增預測變數X1可以產生的迴歸效應有多大感到興趣,可以先將Y對變數X2進行迴歸程序,得到下面的配適值與殘差: (10.1a) (10.1b) 這裡所用的符號明白指出所配適之迴歸模型其反 應及預測變數,另外將X1對變數X2進行迴歸程 序,得到下面的配適值與殘差: (10.2a) (10.2b) 10.2 離群Y觀測值之確認: t化去點殘差 離群個案 殘差與半t化殘差 在前面的章節中曾經提過以殘差為基礎,從而發現離群或是極端的Y觀測值,當時用殘差ei表示: (10.8) 或是半t化殘差表示: (10.9) 帽子矩陣 (6.30a)的帽子矩陣如下: (10.10) 在(6.30)中曾經提過配適值 可以透過帽子矩陣表示 為觀測值Yi之線性組合: (10.11) 在(6.31)中我們也提過殘差ei可以透過帽子矩陣表示 為觀測值Yi之線性組合: (10.12) 而在(6.32)中所提及殘差之的共變異矩陣也牽涉到帽 子矩陣: (10.13) 因此,殘差ei的變異數 為: (10.14) 其中,hii為帽子矩陣的主對角線之第i個元素,而殘 差ei與ej的共變異數為: (10.15) 其中,hij為帽子矩陣的主對角線之第i列第j行元素。 上述的變異數與共變異數的估計,可以用MSE作為 誤差變異數 之估計,代入後可以得到: (10.16a) (10.16b) t化殘差 為了使殘差能夠更有效率地用以發現離群觀測值Y,因此我們考慮每一個殘差ei相對於其估計之標準差大小,用以認知各殘差存在的不同抽樣誤差,在(10.16a)中,我們可以得到關於ei標準差之估計量: (10.19) 殘差ei對s{ei}之比率稱為t化殘差,用ri表示: (10.20) 去點殘差 先剔除第i個個案後,用剩下的n-1個個案資料進行模型配適,然後計算第i個個案其X值下的模型配適值 ,用符號di表示為: (10.21) 此一差異值di稱為第i個個案的去點殘差 有一個不需要重新計算剔除第i個個案後進行模型配適,便可計算di之等價代數式為: (10.21a) 其中ei為一般情形下的第i個個案之普通殘差,而hii為帽子矩陣之第i個對角線元素 利用n – 1個個案資料進行模型配適,來預測第n個「新」觀測值,現在重寫(6.63a)之結果來得到di之變異數估計: (10.22) 其中Xi為第i個個案之X觀測向量(10.18a),MSE(i)為剔除第i個個案之後配適模型出的均方誤差,X(i)為剔除第i個個案之後的X矩陣,關於s2{di}之等價代數式為: (10.22a) 根據(6.63)有下面的結果: (10.23) t化去點殘差 用ti表示t化去點殘差為: (10.24) 利用(10.21a)與(10.22a)可以得到ti之等價代數式為: (10.24a) MSE與MSE(i)間存在著一個簡單之關係如下: (10.25) 利用(10.24a)的關係式可以得到下面的ti等價公式為: (10.26) 離群值檢定 10.3 離群X觀測值之確認: 帽子矩陣槓桿值 使用帽子矩陣確認離群X觀測值 帽子矩陣的對角線元素hii具有一些不錯的性質,例如: (10.27) 其中p為迴歸函數中含截距項在內的迴歸參數之個數 當一個槓桿值之大小超過平均槓桿值 的兩倍時,通 常會被視為過大,此一平均值可以依據(10.27)定義如 下: (10.28) 使用帽子矩陣確認隱藏外插點 將(10.18)的槓桿值計算方式應用至將推論的新X值: (10.29) 10.4 辨識影響個案:DFFITS、Cook距離、DFBETAS量數 對單一配適值之影響:DFFITS 關於第i個個案對於配適值 之影響力可以透過: (10.30) 其中字母DF表示「差異」 可以將(DFFITS)i證明出僅需使用完整資料集便可簡單完成之計算公式: (10.30a) 對所有配適值之影響─Cook距離 Cook距離考慮第i個個案對所有的n個個案配適值之影響性,我們用符號Di表示第i個個案對所有的n個個案配適值之Cook距離,其定義為: (10.33) 用矩陣型式表示Cook距離為: (10.33a) Cook距離Di並不需要進行n個個案一一輪流剔除才能進行模型配適,我們有下面的等價代數公式:

文档评论(0)

2105194781 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档