- 1、本文档共6页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
回归分的标准操作程序-1.net.doc
迴歸分的標準操作程序(Regression)意謂被解釋變數(Dependent variable)與解釋變數(Independent variable)間存在線性關係(Linear relationship),但不表示這些變數必定存在因果(Causality,或Cause-and-effect)關係。
迴歸分析的方程式 , 其中假設誤差項滿足 ,也就是「觀察值」=「X的函數」+「誤差」,尋找與被解釋變數Y與解釋變數間,最有關聯的函數型態。因此,迴歸分析可分為兩個步驟:找出最合適的X的函數與殘差檢定,在第一個步驟裡找出與Y變數有最高相關的模型,包括X間是否存在共線性(Multi-collinearity);第二步驟則驗證找出的模型沒有明顯的瑕疵,包括誤差是否符合假設。
步驟一、
迴歸方程式中的X變數不見得是原始的變數,可能是原先記錄變數的變形(如:倒數、平方),因此方程式中所有的X變數必須與Y有線性關係。為確保線性關係,通常在進行迴歸分析前先繪製各X變數與Y的散佈圖(Scatter plots),如果某個X變數與Y的關係不為線性時,將該X變數調整成與Y最有線性關係的函數型態。以下採用Brain size data為例,示範操作程序:
pairs(data[,c(2,1,3,4)],labels=c(brain,gest,body,litter))
Minitab ( Graph ( Matrix Plot
從下列的散佈圖中可看出brain (Y變數)與gest、litter明顯都不是線性關係,可以嘗試gest的二次函數或是對數,litter則是倒數關係。(也可以使用相關係數輔助,判斷是否存在線性關係。)
確定了每個解釋變數X的適當型態,下一步先確定。如果即認定不合適,也就是定義VIF(Variance Inflation Factor),等於1/(1(),在R的「lm」中有「vif」的選項;在Minitab的Stat(Regression(Regression(Options選項中,也可點選「Variance inflation factor」,檢驗解釋變數間是否存在共線性的問題。
Regression Analysis: brain versus gest, gest^2, body, 1/litter
The regression equation is
brain = 74.6 - 1.49 gest + 0.00923 gest^2 + 0.443 body + 6.5 1/litter
Predictor Coef SE Coef T P VIF
Constant 74.55 44.34 1.68 0.096
gest -1.4927 0.5630 -2.65 0.009 11.033
gest^2 0.009234 0.001265 7.30 0.000 13.126
body 0.4425 0.1050 4.21 0.000 3.567
1/litter 6.46 81.74 0.08 0.937 2.351
S = 178.547 R-Sq = 88.1% R-Sq(adj) = 87.6%
如果上式是最佳的函數組合,則在剔除了不顯著變數後,下一步驟則需檢查殘差是否滿足假設。Stepwise regression及Best Subset (Mallow Cp)可用於選取最佳的解釋變數組合,Backward regression也可使用,Forward regression較不推薦。
註:各X變數及Y的Histogram也可用來檢查可能的離群值;上述分析中變數gest及gest^2存在輕微的共線性,在去除不顯著變數後尚可接受,因此最後選取gest、gest^2及body三個變數。
步驟二、
殘差檢查包括常態分配、固定變異數、獨立性三部分。有些統計學教科書建議常態分配依賴「qq-plot」或「normality plot」判斷,但會有陷於自由心證的疑慮,建議使用正式的統計檢定,例如:常態分配檢定「normality test」可選用諸如「Kolmogorov-Smirnov test」等方法。
執行迴歸分析之後(Stat(Regression(Storage),先繪出殘差圖:
Stat(Basic Statistics(Normality Test
(顯然常態分配的假設不滿足(由圖形及檢定值都可看出),必須調整。
’s and Bartlett’s tests),在此僅顯示Levene’s test。在Minitab的指令中,
文档评论(0)