第十一讲 回归分析.pptVIP

  1. 1、本文档共24页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十一讲 回归分析 主讲内容 回归分析实际上就是建立某种数学模型并做检验。假定:一列(或多列)数据的变化同另一列数据的变化呈某种函数关系,获是衡量数据联系强度指标,并检验指标符合程度,就称为回归分析。 回归分析包括:一元回归、多元回归以及线性回归和非线性回归: 一元回归:Y=BX+C(方程中的B为回归系数,C为常数) 多元回归: Y=B1X1+B2X2…+ BnXn + B0 或者是非线性回归方程:Y=f(X) 回归分析要考察的内容 (1)拟合优度检验 回归方程的拟合优度检验一般用判定系数R2实现。 (2)回归方程的显著性检验(F检验) (3)回归系数的显著性检验(t检验)只能检验所有回归系数是否同时与零有显著性差异 (1)强行介入法Enter(一次性进入) 这是一种不检验F和Tolerance,一次将全部自变量无条件地纳入回归方程。 (2)强行剔除Remove(一次性剔除) 指定某些变量不能进入方程。这种方法通常同别的方法联合使用,而不能首先或单独使用,因为第一次使用或单独使用将意味着没有哪个变量进入方程。 (3)逐步进入Stepwise 每次选择符合进入条件的自变量进入方程,进入后立即检验,不合格者剔除,直到全部合格自变量进入方程。 (4)反向剔除Backward 先强行介入,再逐个剔除不合格变量,直到全合格。 (5)正向进入Forward 每次选择符合进入条件的自变量进入方程,逐个选择,逐个进入,直到全部合格自变量进入方程。 实例演示 以数据,水稻产量.sav为例演示 问题:1.要求以水稻播种面积(x1)预测一下水稻产量(y)。 2.要求以水稻播种面积(x1),化肥使用量(x2),生猪存栏数(x3),水稻扬花期降雨量(x4),预测一下水稻产量(y)。给的数据是以年为单位的过去收集数据。 先演示选择一个变量X1,再演示选入四个变量,再演示采用stepwise法引变量 窗口参数设置介绍 窗口参数设计介绍 结果解读 结果解读 线性回归分析注意点 1、本质上自变量引入越多,模型越准确,但不符合简约原则。 2、模型引入方式最好都试一试,看一看R平方的大小,和引入变量后,各个变量的回归系数检验是否显著,再决定采用哪些自变量,放弃哪些自变量。 本例,从结果上来讲,我会最终选择只引入X2和X3,这个数据是假数据不是真实的数据,所以出现这样的结果。 3.非线性回归 基础知识:迭代算法 先要指定一个描述变量关系的准确的函数模型 选择好初始值 尽量把非线性拟合转化为线性拟合 借助于散点图直观地观察变量变化,确定恰当的函数模型 各种非线性模型 实例演示 例2-4-1??炼钢厂出钢时盛钢水的钢包在使用过程中受钢水和炉渣侵蚀,其容积不断增大。试以钢水的钢包.sav为例(由于容积不便测量,故以钢包盛满钢水重量表示)的一组实测数据。试求出二者之定量关系式。 分析演示 画散点图 第二方法为转化法 采用compute把原来的值转换,再采用线性拟合 窗口设置讲解 以此来演示Curve estimation 结果解读 4.Logistic 回归分析 需要判断某些事是否要发生,如候选人是否当选,特别是因变量只有两个值0或者1。 逻辑回归分析是对定性变量的回归分析。 可用于处理定性因变量的统计分析方法有:判别分析(Discriminant analysis)、Probit分析、Logistic回归分析和对数线性模型等。在社会科学中,应用最多的是Logistic回归分析。 Logistic回归分析根据因变量取值类别不同,又可以分为Binary Logistic回归分析和Multinomi-nal Logistic回归分析。 演示 医学中用的比较多 以baixuebing.sav为例演示 数据片是50例急性淋巴细胞性白血病的病人在入院治疗时取得的外周血中的细胞数x1(千个/mm)、淋巴浸润等级x2(分为0,1,2,3四级),其它资料如,出院巩固治疗x3(有为1,无为2)随访取得病人的生存时间t(月),变量Y(生存时间1年以内为0,1年以上为1), 窗口说明 苏州品信管理咨询公司 复习回归分析基础知识 1 线性回归分析 2 非线性回归分析 3 Logistic estimation 4 1.回归分析知识复习 误差平方和 回归 平方和 总离差平方和 2. 线性回归分析 自变量纳入回归方程的方式 选入因变量 选入自变量 R值 回归方程是显著的 得到 的回归 系数和常数项 回归 系数 检验 结果 残卷呈 正态分布 特点:开始时y值增加很快,随后逐渐减慢趋于平缓。据此,我们试用双曲线表示容积y与使用次数x之间的函数关系 这种方法很难 确定迭代初始值 只有不断地试 Binary Logistic回归模型中因变量只能取两个值1和0(

您可能关注的文档

文档评论(0)

专业好文档 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6110200002000000

1亿VIP精品文档

相关文档