- 1、本文档共79页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
管理统计学 2010年 8 线性回归 8.1 回归分析概述 8.2 一元线性回归 8.3 多元线性回归 8.4 二维Logistic回归 8.1.1 回归分析的基本概念 回归分析过程:把一个变量作为自变量,另一个作为因变量,建立二者的数学表达式,从自变量估计因变量的取值 回归分析:通过提供变量之间的数学表达式来定量描述变量间相关关系的数学过程 数学表达式(经验公式) 利用概率统计知识验证公式的有效性 根据自变量的取值预测因变量的取值 如多因素作为自变量,找出对因变量影响显著的 应用广泛 生物统计;医学统计 数据挖掘(预测和控制二功能) 相关分析能够为回归分析提供自变量,相关分析是回归分析的前提和基础 8.1.2 回归分析步骤 定回归方程中的解释变量和被解释变量 解释变量(x);被解释变量(y) 有别于相关分析(如:父亲身高关于成年儿子身高的回归分析与成年儿子身高关于父亲身高的回归分析时完全不同的 ) 确定回归模型:通过观察散点图确定应通过哪种数学模型来概括回归线 建立回归方程:在一定的统计拟合准则下估计出模型中的各个参数,得到一个确定的回归方程 对回归方程进行各种检验 :检验回归方程时否真实地反映了事物总体间的统计关系以及回归方程能否用于预测等 利用回归方程进行预测:根据回归方程对事物的未来发展趋势进行预测 8.2 一元线性回归 一元线性回归分析 研究某一现象与影响它的某一最主要因素的影响 排除其他影响因素或假定其他影响因素确定的条件下,分析某一个因素(自变量)是如何影响另一事物(因变量)的过程 比较理想化 举例 如影响粮食产量的因素非常多,但在众多因素中,施肥量是一个重要的因素,往往需要研究施肥量这一因素与粮食产量之间的关系 在消费问题的研究中,影响消费的因素很多,但我们可以只研究国民收入与消费额之间的关系,因为国民收入是影响消费的最主要因素 保险公司在研究火灾损失的规律时,把火灾发生地与最近的消防站的距离作为一个最主要因素,研究火灾损失与火灾发生地距最近消防站的距离之间的关系 对所研究的问题首先要收集与它有关的n组样本数据(xi,yi) ,i=1,2,…,n。为了直观地发现样本数据的分布规律,把(xi,yi)看成是平面直角坐标系中的点,画出这n个样本点的散点图 例8.1化肥施用量与粮食产量的关系 为准确地定出化肥施用量的单位变化如何影响粮食产量的平均单位变化,进而确定合理的化肥施用量 例8.2 人均消费金额和人均国民收入 收集到1986~2005年20年的样本数据 人均消费金额和人均国民收入(续) 从例8.1和8.2的散点图看到样本数据点(xi,yi)大致都分别落在一条直线附近 说明变量x与y之间具有明显的线性关系 这些样本点有不都在一条直线上,表明变量x和y的关系并没有确切到给定x就可以唯一确定y的程度 对y产生影响的因素还有许多,如人家消费金额不仅受人均国民收入的影响,还与上年的消费水平、银行利率、商品价格指数等有关,这些对y的取值都有随机影响 把每个样本点与直线的偏差就可看做是其他随机因素的影响 8.2.1 一元线性回归模型 一元线性回归模型/简单线性回归模型 只有一个解释变量的线性回归模型 解释被解释变量与另一个解释变量之间的线性关系 建立模型 因变量(y):被预测或被解释的变量;自变量(x):预测或解释因变量的一个或多个变量 假定自变量是可控制的,而因变量是随机的 近似的线性函数关系: 反映了由于x的变化引起的y的线性变化 ε:误差项的随机变量 它反映了除x和y之间的线性关系之外的随机因素对y的影响,是不能由x和y之间的线性关系所解释的变异性 它是未包括在模型中而又影响y的全部变量的替代物 β0和β1:模型的参数 8.2.1 一元线性回归模型 德国数学家高斯最早提出的 高斯假定/标准假定 回归分析的假定条件(随机误差项ε是无法直接观测的 ) 误差项的期望值为0 误差项的方差为常数 误差项之间相互独立,其协方差为零 Cov(xi,ε)=0,即xi和ε不存在相关关系 随机误差项服从正态分布。独立性意味着对于一个特定的x值,它所对应的y值与其他x所对应的y值也不相关.这表明,在x取某个确定值的情况下,y的变化由误差项ε的方差σ2来决定 8.2.2 参数的最小二乘估计 一元线性回归方程(y的期望值是x线性函数 ) : 总体回归参数β0和β1是未知的 回归分析的主要任务:利用样本数据区估计β0和β1 样本统计量 和 代替位置参数 估计的回归方程 : 对于第i个x值 : 用于描述其关系的直线有多条 ,利用最小二乘法选择最适合代表两个变量关系的 最小二乘估计(续) “二乘”(平方):寻找一条直线,使得所有点
文档评论(0)