- 1、本文档共96页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[教育学]8一元线性回归
一元线性回归 1 变量间关系的度量 2 一元线性回归 3 利用回归方程进行预测 4 案例讨论及软件应用 1.1 变量间的关系 函数关系 (1)是确定的关系 (2)设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量 (3)各观测点落在一条曲线上 函数关系(几个例子) 相关关系(correlation) (1)变量间关系不能用函数关系精确表达 (2)一个变量的取值不能由另一个变量唯一确定,但当一个或若干个变量X取一定值时,与之相对应的另一个变量Y的值虽然不确定,但却按某种规律在一定范围内变化。 (3)当变量 x 取某个值时,变量 y 的取值可能有几个 (4)各观测点分布在直线(或曲线)周围 相关关系(几个例子) 相关关系(类型) 散点图(scatter diagram) 散点图 (例题分析) 【例】一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等项目的贷款。近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的增长,这给银行业务的发展带来较大压力。为弄清楚不良贷款形成的原因,希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款的办法。下面是该银行所属的25家分行2002年的有关业务数据 散点图(例题分析) 散点图(例题分析) 相关关系的描述与测度相关系数 (correlation coefficient) (1)对变量之间关系密切程度的度量 (2)对两个变量之间线性相关程度的度量称为简单相关系数 (3)若相关系数是根据总体全部数据计算的,称为总体相关系数,记为? (4)若是根据样本数据计算的,则称为样本相关系数,记为 r 样本相关系数 (计算公式) ? 样本相关系数的计算公式 相关系数(取值及其意义) r 的取值范围是 [-1,1] |r|=1,为完全相关 r =1,为完全正相关 r =-1,为完全负正相关 r = 0,不存在线性 相关关系 -1?r0,为负相关 0r?1,为正相关 |r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切 下面图形说明上述关系: 相关系数(取值及其意义) 相关关系 1、X和Y是地位相互对称的随机变量,所以有r(X,Y)=r(Y,X). 2、相关系数只反映变量间的线性相关程度,不能说明非线性相关关系。 3、相关系数只能反映变量间线性相关的程度,并不能确定变量的因果关系,也不能说明这种相关关系具体接近于哪条直线。 相关系数矩阵(例题分析) 什么是回归分析?(Regression) (1)从一组样本数据出发,确定变量之间的数学关系式(数学分析与统计分析) (2)对这些关系式的可信程度进行各种统计检验(在经济意义的基础上),并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著 (3)利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度 “回归” 一词的历史渊源 “回归”一词最早由Francis Galton引入。 Galton发现,虽然父母的身高对子女的身高起到决定性作用,但给定父母的身高后,他们儿女辈的平均身高却趋向于或者“回归”到社会平均水平。Galton的普遍回归定律(law of universal regression)。 Galton的朋友Karl Pearson通过收集一些家庭的1000多名成员的父子身高数据,证明儿子确实“回归到中等(regression to mediocrity)” 回归分析与相关分析的区别 (1)相关分析中,变量 x 变量 y 处于平等的地位;回归分析中,变量 y 称为因变量,处在被解释的地位,x 称为自变量,用于预测因变量的变化 (2)相关分析中所涉及的变量 x 和 y 都是随机变量;回归分析中,因变量 y 是随机变量,自变量 x 可以是随机变量,也可以是非随机的确定变量 (3)相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由回归方程进行预测和控制 回归模型的类型 2.1 一元线性回归 (1)涉及一个自变量的回归 (2)因变量y与自变量x之间为线性关系 被预测或被解释的变量称为因变量(dependent variable),用y表示 用来预测或用来解释因变量的一个或多个变量称为自变量(independent variab
文档评论(0)