第六讲相关与回归法选读.ppt

  1. 1、本文档共131页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
相关分析 回归分析 函数关系:即当一个(或一组)变量每取一个值时,相应的另一个变量必然有一个确定值与之相对应 。 相关关系:变量之间存在依存关系,但这是不完全确定的随机关系,即当一个(或一组)变量每取一个值时,相应的另一个变量可能有多个不同值与之对应 。 相关系数若是根据总体数据计算的,称为总体相关系数,记为(方差占总差的比例) 相关系数若是根据样本数据计算的,则称为样本相关系数,记为 r。样本相关系数是总体相关系数的一致估计量。 显著性检验(significance test)是事先对总体的参数或总体分布形式做出一个假设,然后利用样本信息来判断这个假设是否合理,即判断总体的真实情况与原假设是否有显著性差异。或者说,显著性检验要判断样本与对总体所做的假设之间的差异是纯属机会变异,还是由假设与总体真实情况之间不一致所引起的。 显著性检验是针对我们对总体所做的假设做检验,其原理就是“小概率事件实际不可能性原理”来接受或否定假设。 抽样实验会产生抽样误差,在进行比较分析时,不能仅凭结果的不同就作出结论,而是要进行统计学分析,鉴别出两者差异是抽样误差引起的,还是由特定的实验处理引起的。 采用 t 检验 在二元正态总体情况下,r的抽样分布具有确定的函数形式,当总体相关系数 时,r呈t分布(n=30)。 例1: r =0.9987?=0.05 (13-2)=0.553 人均消费金额与人均国民收入之间有十分显著的线性相关关系。 例2: r =0.9878 ?=0.05 (10-2)=0.632 总体人均消费支出与人均可支配收入之间有十分显著的线性相关关系。 回归模型(数学模型) 回答变量之间是什么关系? 方程中运用 1 个因变量(响应变量、被解释变量) 被预测的变量 1 个或多个自变量 (解释变量) 用于预测的变量 3. 主要用于预测和估计 回归模型的类型 建立回归方程的关键在于如何确定参数 与 的值; 一般采用最小二乘法来求 与 的值。 根据微积分的极值定理,Q最小的必要条件为: 整理后所得方程称最小二乘法的标准方程: 将表中数据代入公式中: 生产费用对产量的直线回归方程为: 总离差平方和的分解 因变量 y 的取值是不同的,y 取值的这种波动称为变差。变差来源于两个方面: 由于自变量 x 的取值不同造成的; 除 x 以外的其他因素(如x对y的非线性影响、测量误差等)的影响。 对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差 来表示。 离差平方和的分解 (图示) 离差平方和的分解 (三个平方和的关系) 2. 两端平方后求和有 反映回归方程的拟合程度; 取值范围在 [ 0 , 1 ] 之间; R2 ?1,说明回归方程拟合的越好;R2?0,说明回归方程拟合的越差; 一元线性回归中,判定系数等于y和x相关系数的平方,即R2=(r)2。 确定显著性水平?,并根据分子自由度1和分母自由度n-2找出临界值F ? 作出决策:若FF ?,拒绝H0;若FF ?,不能拒绝H0 F检验表(α=0.05) 一元线性回归分析的计算实例 已知某品牌汽车2002-2008年的年销售额如下表所示,试用一元线性回归分析法预测2010年和2012年的汽车销售额。 计算单位:万辆 (1)根据数据表绘散点图 (2)建立一元线性回归模型,数据计算 (2)建立一元线性回归模型,数据计算 (3)求相关系数R (4)回归方程效果的F检验 (5)计算预测值 解:分析变量之间的关系 多元线性回归分析的计算实例 多元线性回归分析的计算实例 多元线性回归系数 (1)R检验。对蔬菜销售量(因变量)和人口数、蔬菜年平均价格、年人均副食消费量(自变量)的相关系数进行分析,确定是否可以利用三元线性回归模型。通过对相关系数的分析判断所选择的自变量是否对因变量有显著性影响。相关系数计算如下表。将相关系数代入R中,得到相关系数R为0.9323,表明自变量与因变量之间高度正相关,三元线性回归方程可用于未来蔬菜需求量预测。 (2)F检验(回归方程显著性检验)。通过F检验,可知回归方程参数同时为零的概率是否小于5%。F值的相关数据如下表。显著性水平α=0.05,查F检验表,自由度为(3,6)得F分布临界值,Fα=4.76,F Fα,F检验通过。 (3)确定预测值。根据所得的回归分析模型,若2009年消费人口为570万,蔬菜年平均价格为14.5角,副食年人均消费量为52.5千克,则2009年的蔬菜消费量的预测值为: 可转换为线性回归分析的非线性模型 (一)抛物线函数 (二)双曲线函数 (三)幂函数 (四)指数函数 (五)对数函数 (六

文档评论(0)

希望之星 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档