多元回归分析的原理与应用.ppt

  1. 1、本文档共42页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
多元回归分析的原理与应用

多元回归分析 的原理与应用 提 纲 多元回归分析的统计原理 多元回归分析在心理学研究中的应用 1 多元回归分析(regression)的统计原理 回归分析的含义 回归分析的分类 一元线性回归 多元线性回归 在SPSS中如何做多元回归分析 1.1 回归分析的含义 客观世界中事物之间的关系是各种各样的。从定量的角度看,主要有两种:一是确定性关系,如重力加速度,即自由落体的距离与时间:S=0.5gt2;另一类是不确定性关系,即相关关系。 由于事物的变化常常受多种因素的影响,导致了事物变化的不确定性。人们常用相关系数来描述事物之间的这种不确定性程度。 但对于如何通过一个事物的值去估计和预测另一个事物的发展变化,相关系数却无能为力。但是,通过大量的实际调查,可以总结出它们之间的关系,回归分析即是对这种关系的描述。 1.1 回归分析的含义 “回归”一词最早由英国统计学家高尔顿(Francis Galton)在19世纪末期研究孩子的身高和他们父母身高关系时提出。 研究发现,孩子的身高总是趋于他们父母身高的平均值。孩子的身高,比身材矮的父母要高,比身材高的父母要矮,这种趋于中间值的趋势称作“回归效应”,而他提出的这种研究两个数值变量关系的方法称作回归分析。 1.1 回归分析的含义 含义:是借助数学模型对客观世界所存在的事物间的不确定关系的一种数量化描写,即通过一个或几个变量的变化去解释另一变量的变化。 目的:在于对相关随机变量进行估计、预测和控制,确定变这些量之间数量关系的可能形式,并用一个数学模型来表示。 1.1 回归分析的含义 数学模型: y=f(x1,x2,x3,…,xi)+? 模型的基本含义: 因变量y受到两部分自变量的影响,即:已知的K个自变量x1,x2,x3,…,xi的影响;一些未知因素或随机因素的影响。对于K个已知自变量的影响,设想可以通过函数f(x1,x2,x3,…,xi)来表示,而剩下的将由那些未知因素或随机因素的影响确定,将这些影响的结果记为?,称为随机误差。对于每一组实际观察获得的值yi,x1,x2,x3,…,xi就可以表示成: yi= f(x1,x2,x3,…,xi)+? 1.1 回归分析的含义 对于自变量x1,x2,x3,…,xi的每一组确定的值,f(x1,x2,x3,…,xi)的值也是确定的;但由于?是不确定的,所以,y也是不确定的,但在每一组确定的自变量之下,所有的?服从均数为零的正态分布,因此,对于自变量的每一组确定的值,因变量也服从正态分布,其平均数就是f(x1,x2,x3,…,xi),该公式即为回归方程,记为: 1.3 一元线性回归 只有一个自变量的线性回归叫一元线性回归,也叫简单回归。 与方差分析不同,在回归分析中,“元”是指自变量,而不是指因变量。 最小二乘法 因为一组数据可以有多条回归直线,但是哪条最理想呢? 想得到比较精确的回归方程,必须使用最小二乘法。 最小二乘法就是使误差的平方和最小。 误差e就是残差ε, e=y-y,其平方和为: ∑(y-y)2=∑(y-a-bx)2 要使误差最小,只要分别对a、b求偏导数,使其=0即可。 判定系数与相关系数 判定系数与相关系数 从二者的计算公式可知,积差相关系数r的平方等于判定系数r2,即Y 的变异性能被估计的回归方程解释的部分所占比例的大小。 如果r2=0.64,表明变量Y的变异中有64%是由变量X的变异引起的。所以,r2叫判定系数。 1.4 多元线性回归(Multiple Regression) 多元线性回归,就是有多个自变量的线性回归,也叫复回归。 其数学模型为: 1.4 多元线性回归 多元回归分析的基本假设 多元回归方程及其显著性检验 筛选自变量的方法 多元回归方程有效性的判定 1.4.1 多元回归分析的基本假设 相关存在性:就自变量X1,X2,X3,……XK的特殊组合而言,Y变量(单变量)是一个随机变量,具有某种概率分配,有一定的平均数及变异数,各个变量之间都存在显著相关关系。 独立性:每一个观察值Y彼此间是统计独立的,观察值间没有关联,即非共线性。 直线性:Y 变量的平均数是变量X1,X2,X3,……XK间的线性函数,此线性函数关系即回归方程。 方差齐性:就X1,X2,X3,……XK任何一个组合而言,因变量Y的变异数均相同。 正态性:就任何X1,X2,X3,……XK的线性组合而言,因变量Y的分配是正态的。 1.4.2 多元回归方程及其显著性检验 多元回归的样本与总体的回归方程: 1.4.2 多元回归方程及其显著性检验 回归方程的显著性检验,就是检验样本回归方程的变量的线性关系是否显著,即能否根据样本来推断总体回归方程中的多个回归系数中至少有一个不等于0,主要

文档评论(0)

yan698698 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档