- 1、本文档共17页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SAS学习系列25.非线性回归概要
25. 非线性回归现实世界中严格的线性模型并不多见,它们或多或少都带有某种程度的近似;在不少情况下,非线性模型可能更加符合实际。对变量间非线性相关问题的曲线拟合,处理的方法主要有:(1)首先确定非线性模型的函数类型,对于其中可线性化问题则通过变量变换将其线性化,从而归结为前面的多元线性回归问题来解决;(2)若实际问题的曲线类型不易确定时,由于任意曲线皆可由多项式来逼近,故常可用多项式回归来拟合曲线;(3)若变量间非线性关系式已知(多数未知),且难以用变量变换法将其线性化,则进行数值迭代的非线性回归分析。(一)可变换为线性的非线性回归在很多场合,可以对非线性模型进行线性化处理,尤其是可变换为线性的非线性回归,运用最小二乘法进行推断,对线性化后的线性模型,可以应用REG过程步进行计算。例1有实验数据如下:X1.11.21.31.41.51.61.71.81.922.12.22.32.4Y109.9540.4520.0924.5311.027.394.952.721.821.490.820.30.20.22试分别采用指数回归(y?=aebx?)方法进行回归分析。代码:data exam25_1;input x y;cards;1.1 109.951.2 40.451.3 20.091.4 24.531.5 11.021.6 7.391.7 4.951.8 2.721.9 1.822 1.492.1 0.822.2 0.32.3 0.22.4 0.22;run;procsgplotdata = exam25_1;scatterx = x y = y;run;proccorrdata = exam25_1;var x y;run;data new1;set exam25_1;v = log(y);run;procsgplotdata = new1;scatterx = x y = v;title变量代换后数据;run;procregdata = new1; var x v;model v = x; printcli; title残差图;plotresidual. * predicted.;run; data new2; set exam25_1;y1 = 14530.28*exp(-4.73895*x); run; procgplotdata = new2; plot y*x=1 y1*x=2 /overlay; symbolv=dot i=nonecv=red; symbol2i=smcolor=blue;title指数回归图;run;运行结果:程序说明:(1)调整后的R2=0.9831,说明拟合程度很好;F检验的P值=0.0001α=0.05,拒绝原假设,故直线回归的斜率不为0;(2)将线性回归系数代入,得到原回归方程y =14530.28*e?4.73895x(3)残差图趋势,符合残差随机正态分布的假设(不带其它明显趋势)。二、多项式回归一般函数都可用多项式来逼近,故多项式回归分析可用来处理相当广泛的非线性问题。对观测数据 (xt, yt), t=1,…,N. 多项式回归模型为:令则模型可写为:Y=XB+ε当X列满秩时,用最小二乘估计可求得其多项式回归方程。但由于的计算既复杂又不稳定,故一般采用正交多项式法来进行多项式回归。多项式模型可以直接应用GLM(广义线性模型)求解。例2重庆市种畜场奶牛群1—12月份(x1),产犊母牛平均产奶量(y)的资料如程序数据步中,试对该资料配置一个合适的回归方程。代码:data exam25_2;input x1 y @@; x2=x1*x1; datalines; 1 3833.43 7 3476.76 2 3811.58 8 3466.22 3 3769.47 9 3395.42 4 3565.74 10 3807.08 5 3481.99 11 3817.03 6 3372.82 12 3884.52 ; run;procsgplotdata = exam25_2; scatterx = x1 y = y;title原始数据散点图;run; procregdata = exam25_2; model y=x1 x2; run; 运行结果:程序说明:(1)观察数据的散点图,更适合二次多项式拟合,也可以测试几种不同次数的多项式拟合选择其中最优的;(2)将回归系数代入多项式方程得到:y= 4117.20136 -204.93668x1+15.78570x12三、不能变换为线性的非线性回归该类非线性回归分析就是利用最小二乘准则来估计回归系数β,使得残差平方和最小。一般来用数值迭代法来进行,先选定回归系数的初值β0,按照给定的步长和有哪些信誉好的足球投注网站方向逐步迭代,直到残差平方和达到
文档评论(0)