- 1、本文档共82页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
(改) 89第2章(清) 一元线性回归
什么是回归分析?(regression) 从一组样本数据出发,确定变量之间的数学关系式 对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著 利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度 趋向中间高度的回归 回归这个术语是由英国著名统计学家Francis Galton在19世纪末期研究孩子及其父母的身高时提出来的。Galton发现身材高的父母,他们的孩子身材也高。但这些孩子平均起来并不像他们的父母那样高。对于比较矮的父母情形也类似:他们的孩子比较矮,但这些孩子的平均身高要比他们的父母的平均身高高。 Galton把这种孩子的身高向平均值靠近的趋势称为一种回归效应,而他发展的研究两个数值变量的方法称为回归分析 回归分析与相关分析的区别 相关分析中,变量 x 变量 y 处于平等的地位;回归分析中,变量 y 称为因变量,处在被解释的地位,x 称为自变量,用于预测因变量的变化 相关分析中所涉及的变量 x 和 y 都是随机变量;回归分析中,因变量 y 是随机变量,自变量 x 是非随机的确定变量 相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制 回归模型(regression model) 回答“变量之间是什么样的关系?” 方程中运用 1 个数值型因变量(响应变量) 被预测的变量 1 个或多个数值型或分类型自变量 (解释变量) 用于预测的变量 3. 主要用于预测和估计 回归模型的类型 第2章 线性回归分析 主要内容 回归模型的参数估计及其统计推断、残差分析和回归方程的选取.以及预测与控制。 目的:建立线性回归方程 应用:预测与控制 2.1.1一元线性回归模型 涉及一个自变量的回归 因变量y与自变量x之间为线性关系 被预测或被解释的变量称为因变量(dependent variable),用y表示 用来预测或用来解释因变量的一个或多个变量称为自变量(independent variable),用x表示 因变量与自变量之间的关系用一个线性方程来表示 一元线性回归模型 描述因变量 y 如何依赖于自变量 x 和误差项? 的方程称为回归模型 一元线性回归模型可表示为 y = b0 + b1 x + e y 是 x 的线性函数(部分)加上误差项 线性部分反映了由于 x 的变化而引起的 y 的变化 误差项 ? 是随机变量 反映了除 x 和 y 之间的线性关系之外的随机因素对 y 的影响 是不能由 x 和 y 之间的线性关系所解释的变异性 ?0 和 ?1 称为模型的参数 一元线性回归模型(基本假定) 因变量y与自变量x之间具有线性关系 在重复抽样中,自变量x的取值是固定的,即假定x是非随机的 误差项ε是一个期望值为0的随机变量,即E(ε)=0。对于一个给定的 x 值,y 的期望值为E ( y ) =? 0+ ? 1 x 对于所有的 x 值,ε的方差σ2 都相同 误差项ε是一个服从正态分布的随机变量,且相互独立。即ε~N(0 ,σ2 ) 独立性意味着对于一个特定的 x 值,它所对应的ε与其他 x 值所对应的ε不相关 对于一个特定的 x 值,它所对应的 y 值与其他 x 所对应的 y 值也不相关 一元线性回归模型(基本假定) 回归方程 (regression equation) 描述 y 的平均值或期望值如何依赖于 x 的方程称为回归方程 一元线性回归方程的形式如下 E( y ) = ?0+ ?1 x 估计的回归方程(estimated regression equation) 2.1.2参数的最小二乘估计 最小二乘估计(method of least squares ) Karl Gauss的最小化图 最小二乘法 ( 和 的计算公式) 一元线性回归的参数估计 一元线性回归模型 观测值为 (x1, y1), (x2, y2), … ,(xn, yn) 回归参数的最小二乘估计为 一元线性回归的参数估计 方差?2的无偏估计为 经验回归方程 或者 【例】一家大型商业银行在多个地区设有分行,为弄清楚不良贷款形成的原因,,抽取了该银行所属的25家分行2002年的有关业务数据。试建立不良贷款y与贷款余额x1的线性回归方程,并解释回归系数的含义 一元线性回归最小二乘法图 示 估计方程的求法(例题分析) 【例】求不良贷款对贷款余额的回归方程 估计方程的求法(例题分析) 不良贷款对贷款余额回归方程的图
文档评论(0)