简单线性回归初步.PPTVIP

  1. 1、本文档共75页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
简单线性回归初步

第四节 非线性回归 非线性回归要比线性回归更能充分地表达变量间的关系。当今线性回归之所以比非线性回归应用甚多,原因在于无论从数学理论还是计算方法,线性回归都比非线性回归模型简单得多。 通过自变量的变换实现线性化 实践中有两类非线性关系,一类是通过自变量X的适当变换可线性化的,另一类是不可能通过自变量X的变换实现线性化的 X数据变换 不能线性化的关系 变换自变量实现线性回归步骤 1.将观测数据(Xi, Yi), i=1,2,…,n作散点图,观察散点分布特征类似于何种函数类型; 2.按照所选定的函数进行相应的变量变换; 3.对变换后的数据用常规最小二乘法(OLS)作线性模型的参数估计。 4.一般拟合多个相近的模型,然后通过对各个模型的拟合优度评价挑选较为合适的模型。 例12-2 为了研究某药物浓度与肾上腺素释放的量关系,选取10个给药物浓度水平,每种药物剂量水平上重复5次试验,观测结果如表12-3所示。欲用合适的回归模型描述该药品剂量与反应的规律 药物剂量(mg) 肾上腺素释放量(pg/ml) 15 19.26 14.29 17.60 18.36 16.53 20 21.20 21.78 20.77 20.65 23.38 25 21.77 22.61 22.70 21.17 21.65 30 23.47 23.22 21.74 24.02 24.05 35 23.88 25.32 22.90 24.84 23.70 40 25.27 24.69 24.67 24.48 25.24 45 24.20 24.94 25.52 25.02 27.43 50 27.98 25.88 26.67 26.31 25.94 55 27.42 24.91 26.42 28.24 25.49 60 28.41 27.09 29.04 28.85 27.89 由结果可见:在所拟合的三种模型中,以x对数函数回归的效果最佳,该模型拟合的残差均方最小,决定系数最大 模型名称 回归方程 MSE F值 P值 R2值 简单线性 1.91786 212.48 0.0001 0.8157 对数函数 1.39592 309.88 .0001 0.8659 二次函数 2.72770 135.05 0.0001 0.852 值得一提的是,本节只涉及对自变量X进行变换,然后以变换后的数据用标准最小二乘(OLS)法求解模型的参数估计与模型评价。当涉及到对反因变量y实施非线性变换 [如Z=ln(Y)] 时,因为OLS只保证变换后的Z,即ln(Y)的残差平方和最小,并不能保证原变量Y的残差平方和也最小,所以在此情况下,我们建议用统计软件来完成非线性拟合,例如,用SAS系统中的PROC NLIN 程序产生非线性模型参数的最小二乘估计。 直线回归应用的注意事项 直线回归用于定量刻画因变量Y对自变量X在数值上的依存关系,其中因变量的定夺主要依专业要求而定,可以考虑把易于精确测量的变量作为X,另一个随机变量作Y,例如用身高估计体表面积。 两个变量的选择一定要结合专业背景,不能把毫无关联的两种现象勉强作回归分析。 1.根据分析目的选择变量及统计方法 2.进行回归分析前应绘制散点图 (1) 散点图可考察两变量是否有直线趋势; (2) 可发现异常点(outlier)。 散点图对异常点的识别与处理需要从专业知识和现有数据两方面来考虑,结果可能是现有回归模型的假设错误需要改变模型形式,也可能是抽样误差造成的一次偶然结果甚至过失误差。需要认真核对原始数据并检查其产生过程认定是过失误差,或者通过重复测定确定是抽样误差造成的偶然结果,才可以谨慎地剔除或采用其它估计方法。 3.资料的要求 直线回归要求至少对于每个 X 相应的 Y 要服从正态分布,X可以是服从正态分布的随机变量也可以是能精确测量和严格控制的非随机变量; * 对于双变量正态分布资料,根据研究目的可选择由 X 估计 Y 或者由 Y 估计 X ,一般情况下两个回归方程不相同)。 反应两变量关系密切程度或数量上影响大小的统计量应该是回归系数的绝对值,而不是假设检验的P值。 P值越小只能说越有理由认为变量间的直线关系存在,而不能说关系越密切或越“显著”。另外,直线回归用于预测时,其适用范围一般不应超出样本中自变量的取值范围。 4.结果解释及正确应用 1.方差分析 Y的离均差,总变异 残差 回归的变异 数理统计可证明: 上式用符号表示为 式中 上述三个平方和,各有其相应的自由度 ,并有如下的关系: 如果两变量间总体回归关系确实存在,回归的贡献就要大于随机误差,大到何种程度时可以认为具有统计意义,可计算统计量F: 式中

文档评论(0)

phltaotao + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档