- 1、本文档共28页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
8.2.1一元线性回归模型
;引例:生活经验告诉我们,儿子的身高与父亲的身高相关.一般来说,父亲的身高较高时,儿子的身高通常也较高.为了进一步研究两者之间的关系,有人调查了14名男大学生的身高及其父亲的身高,得到的数据如表1所示.;问题1:根据表中的数据,儿子身高和父亲身高这两个变量之间的关系可以用函数模型刻画吗?;问题2:正是因为存在影响儿子身高的其他因素,如母亲身高、生活环境、饮食习惯等,使得儿子的身高呈现出随机性各种随机因素都是独立的,有些因素又无法量化.你能否考虑到这些随机误差的作用,用类似于函数的表达式,表示儿子身高与父亲身高的关系?;追问1:为什么要假设E(e)=0,而不假设其为某个不为0的常数?;我们称①式为Y关于x的一元线性回归模型.其中,Y称为因变量或响应变量,x称为自变量或解释变量.a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差.;追问1:你能结合父亲与儿子身高的实例,说明回归模型①的意义?;问题4:你能结合具体实例解释产生模型①中随机误差项的原因吗?
;探究:通过样本数据估计参数a和b,相当于寻找一条“最好”的直线,使得表示成对样本数据的这些散点在整体上与这条直线最“接近”;由yi=bxi+a+ei(i=1,2,…,n),得
|yi一(bxi+a)|=|ei|.显然|ei|越小,表示点(xi,yi)与点(xi,bxi十a)的“距离”越小,即样本数据点离直线y=bx+a的竖直距离越小。特别地,当ei=0时,表示点(xi,yi)在这条直线上.
;上式是关于b的二次函数,因此要使Q取得最小值,当且仅当b的取值为;;问题5:依据用最小二乘估计一元线性回归模型参数的公式,求出儿子身高Y关于父亲身高x的经验回归方程。;追问2:根据经验回归方程中斜率的具体含义,高个子的父亲一定生高个子的儿子吗?同样,矮个子的父亲一定生矮个子的儿子吗?;?;问题6:儿子身高与父亲身高的关系,运用残差分析所得的一元线性回归模型的有效性吗?;一般地,建立经验回归方程后,通常需要对模型刻画数据的效果进行分析.借助残差分析还可以对模型进行改进,使我们能根据改进模型作出更符合实际的预测与决策.;(1);???(1)显示残差与观测时间有线性关系,应将时间变量纳入模型;
图(2)显示残差与观测时间有非线性关系,应在模型中加入时间的非线性函数部分;
图(3)说明残差的方差不是一个常数,随观测时间变大而变大;
图(4)的残差比较均匀地集中在以横轴为对称轴的水平带状区域内.;尝试练习;尝试练习;2、求回归直线方程的步骤:
文档评论(0)