- 1、本文档共72页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
例11-1 为研究大气污染物一氧化氮(NO)的浓度是否受到汽车流量、气候状况等因素的影响,选择24个工业水平相近城市的一个交通点,统计单位时间过往的汽车数(千辆),同时在低空相同高度测定了该时间段平均气温(℃)、空气湿度(%)、风速(m/s)以及空气中一氧化氮(NO)的浓度(×10-6),数据如表11-1所示。 解析: 根据常识,大气中的一氧化氮的浓度不仅受到车流量的影响,而且还可能受到气温、空气湿度、风速等因素的影响,因此,要更好地预测空气中一氧化氮的浓度,在线性回归方程中应该包含气温、空气湿度、风速等多个自变量,也即是把包含一个自变量的简单线性回归方程扩展为包含多个自变量的多重线性回归方程。 根据研究的目的和收集到的数据,拟回答如下问题: 单位时间内过往的汽车数(千辆)、气温(℃)、空气湿度(%)、风速(m/s)这四个因素是否都对空气中一氧化氮(NO)的浓度(ppm)有影响? 如何定量地描述这些因素对一氧化氮浓度的影响? 哪个因素对一氧化氮浓度的影响最大?哪个因素的影响最小? 如果利用这些影响因素去预测空气中一氧化氮的浓度,如何预测?效果如何? 多重线性回归分析 多重线性回归分析 基本概念 多重线性回归模型 多重线性回归的应用 结果报告 案例辨析 电脑实验 小结 目的要求 掌握多重线性回归的概念、偏回归系数和标准化偏回归系数的含义; 了解偏回归系数计算方法; 熟悉多重线性回归模型的前提假设; 熟悉偏回归系数及多重线性回归模型的假设检验、自变量的筛选原则和方法; 掌握复相关系数和确定系数的概念; 掌握SPSS计算结果的解释; 了解统计内容的报告与中英文表达。 一、基本概念 多重线性回归(multiple linear regression): 一种重要的、经典的多因素分析方法,是简单线性回归方法的拓展; 采用回归方程的方式定量地描述一个因变量Y 和多个自变量之间的线性依存关系; 多重线性回归只涉及一个因变量,因此,称之为一元线性回归模型; 当模型中包括多个因变量时,称为多元线性回归(multivariate linear regression)或多元线性模型(multivariate linear model)。 自变量筛选与最优模型: 交互作用: 如果某个自变量与因变量的线性关系随着另外一个自变量的取值的改变而改变,我们就说这两个自变量之间存在交互作用或交互效应; 交互效应又称为效应修正(effect modification)。 二、多重线性回归模型 回归方程 回归系数的估计 回归方程的假设检验 回归系数的假设检验 变量筛选 2.1 回归方程 2.2 回归参数的估计: 前提条件:LINE。 最小二乘法 (least square method)。 基本原理是:利用观察或收集到的因变量和自变量的一组数据建立一个因变量关于自变量的线性函数模型,使得这个模型的理论值和观察值之间的残差平方和尽可能地小。 从总体看来,这个回归方程是否有意义?也即是在总体中是否存在这个回归方程所描述的线性关系? 回归方程的效果如何?也即是这四个自变量能够解释反应变量的变异的百分比是多少? 四个自变量是否都对反应变量有影响?也即是各个偏回归系数所对应的总体偏回归系数是否等于0? 2.3 回归方程的假设检验——从总体看来,这个回归方程是否有意义? 2.4 决定系数的计算——回归方程的效果如何?同简单线性回归,从方差分析表中的计算结果可以计算决定系数,以反映回归方程的效果好坏。 对确定系数开平方根得到复相关系数(multiple correlation coefficient) 复相关系数表示随机变量与一组随机变量之间线性相关的程度,其值在0-1之间。复相关系数也可以表示为结果变量的实际观察值与其线性估计值的简单相关系数 确定系数的缺点 :即时在回归方程中增加一些对反应变量贡献很小或者没有贡献的自变量,确定系数的数值也会随自变量个数的增加而增加。 调整的确定系数:如果在回归方程中增加一些对反应变量贡献很小或者没有贡献的自变量,调整的确定系数不会增大,还可能变小。 本例 对调整的确定系数开平方根就得到调整的复相关系数(adjusted multiple correlation coefficient),Rad 2.5 回归系数的假设检验——四个自变量是否都对反应变量有影响? 一般采用检验推断总体偏回归系数是否为零。检验的假设为 H0: βi = 0 H1: βi ≠ 0 α=0.05 检验统计量为 2.6 变量筛选 为确保回归方程包含所有对反应变量有较大影响的自变量,而把对反应变量作用不大或可有可无的自变量排除在方程之外,这一统计过程称为自变
文档评论(0)