- 1、本文档共80页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[相关和回归
程建华 jhcheng0724@163.com Tel* 相关分析与回归分析 相关分析 线性回归模型简介 关于线性回归的高级话题 相关分析 常用术语 直线相关 两变量呈线性共同增大 呈线性一增一减 曲线相关 两变量存在相关趋势 并非线性,而是呈各种可能的曲线趋势 正相关与负相关 完全相关 相关分析 分析过程介绍 Bivariate过程 进行两个/多个变量间的参数/非参数相关分析 如果是多个变量,则给出两两相关的分析结果 Partial过程 对其他变量进行控制 输出控制其他变量影响后的相关系数 这种分析思想和协方差分析非常类似 相关分析 分析过程介绍 Distances过程 对同一变量内部各观察单位间的数值或各个不同变量间进行相似性或不相似性(距离)分析 前者可用于检测观测值的接近程度 后者则常用于考察各变量的内在联系和结构。 一般不单独使用,而是作为预分析过程 相关分析 Bivariate过程 销售额与与竞争对手距离(步行所需时间)间的关系。Corr.sav 散点图 非参数相关系数 步骤: 1、在SPSS中打开数据,并进行数据整理(可略) 2、散点图:判断是否有相关趋势,该趋势是否呈线性 3、进行相关分析 4、考察相关系数和检验结果 相关分析 Partial过程 现已测得20名糖尿病人的血糖、胰岛素及生长激素的测量数据,请分析糖尿病人血糖浓度与生长激素浓度间有无相关关系。pcorr.sav 常识:血糖浓度和胰岛素间存在着密切的关系。 练习 Life.xls是某市从1978年至1992年的一份统计表,内容包括商品零售总额、居民收入和全市人口数,试分析它们之间是否存在线性关系,强度如何。 数据Employee data.sav,试分析工资的高低是否和教育水平相关。 线性回归模型简介 线性回归模型简介 概述 线性回归 非线性回归 针对因变量为分类资料的回归方法 其它回归过程 线性回归模型简介 概述 线性回归 非线性回归 针对因变量为分类资料的回归方法 其它回归过程 线性回归模型简介 模型适用条件 线性趋势 独立性 正态性 方差齐性 如果只是探讨自变量与因变量间的关系,则后两个条件可以适当放宽 样本量 根据经验,记录数应当在希望分析的自变量数的20倍以上为宜。 线性回归模型简介 常用指标 偏回归系数 相应的自变量上升一个单位时,因变量取值的变动情况,即自变量对因变量的影响程度。 标化偏回归系数:①解决量纲问题;②减少在拟合回归模型计算时的截断误差(Roundoff Errors),提高精度 决定系数 相应的相关系数的平方,用R2表示,它反映因变量y的全部变异中能够通过回归关系被自变量解释的比例。 修正的决定系数 线性回归模型简介 分析步骤 做出散点图,观察变量间的趋势 线性回归模型简介 分析步骤 考察数据的分布,进行必要的预处理。即分析变量的正态性、方差齐等问题 进行直线回归分析 残差分析 残差间是否独立(Durbin-Watson检验) 残差分布是否为正态(图形或统计量) 线性回归模型简介 残差分析 自变量与因变量之间存在的线性关系 种观察间相互独立,即任两个观察残差的协方差为0 残差ei服从正态分布N(0,σ2) 方差齐性,即ei的大小不随所有变量的取值水平的改变而改变。 线性回归模型简介 分析步骤 残差分析 线性回归模型简介 分析步骤 强影响点的诊断 多重共线性问题的判断 这两个步骤和残差分析往往混在一起,难以完全分出先后 分析实例 建立销售额与距离间的回归方程。Corr.sav 使用方差分析模型拟合 残差分析 对残差的图形化分析 绘制个体参考值范围以及均值数的可信区间 多重共线性问题的判断 房屋售价影响因素的分析。Homes.sav 关于线性回归模型的高级话题 强影响点的诊断 诊断 多重共线性问题的判断 做出散点图,观察有无离群值 使用Statistic子对话框中的残差诊断指标 使用残差图 关于线性回归模型的高级话题 强影响点的诊断与对策 距离指标 Mahalanobis:多个自变量出现大的马氏距离 Cook’s:大于1 Leveage Values:杠杆值,大于2*p/n 专门的影响力统计量:这几个值越大说明强影响点存在性大。 DfBeta(s):去除观察值后回归系数的变化值 Standardized DfBeta:标准化DfBeta值,大于2/Sqrt(p/n) DfFit:表示去除该观察值后预测值的变化值 Standardized DfBeta:标准化DfFit值,大于2/Sqrt(p/n) Covariance ratio:协方差阵比率,大于3*p/n 关于线性回归模型的高级话题 强影响点的诊断与对策 去除 补充进行个案分析 变量变换 非参数估计 (Nonparam
您可能关注的文档
最近下载
- 高考英语3500词汇(含音标).pdf VIP
- 《自动喷水灭火系统施工及验收规范》GB50261-2017.docx VIP
- -QB-GST200气体灭火控制器说明书.doc
- 《自动喷水灭火系统设计规范》 GB 50084-2017.pdf VIP
- GB50974-2014 消防给水及消火栓系统技术规范.docx VIP
- JB_T 5089.2-2020 内燃机 纸质滤芯机油滤清器 第2部分:滤芯 技术条件.docx VIP
- 湖南省怀化市2023年中考数学试题含答案解析 .pptx VIP
- 六年级上册语文试题期末测试题|学年 河北省保定市 冀教版(含答案).doc VIP
- GB 50300-2013建筑工程施工质量验收统一标准.pdf VIP
- 2023年湖南省怀化市中考模拟数学试题(含答案).docx VIP
文档评论(0)