- 1、本文档共39页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
生产 相关分析和回归分析 描述因变量 y 如何依赖于自变量 x 和误差项? 的方程称为回归模型 一元线性回归模型可表示为 y = a + b x + ? y 是 x 的线性函数(部分)加上误差项 线性部分反映了由于 x 的变化而引起的 y 的变化 误差项 ? 是随机变量 反映了除 x 和 y 之间的线性关系之外的随机因素对 y 的影响 是不能由 x 和 y 之间的线性关系所解释的变异性 a 和 b 称为模型的参数 相关分析和回归分析 做出散点图 考察数据的分布 进行直线回归分析 残差分析 强影响点的诊断及多重共线性的判断 要注意自变量和效应量的内在本质规律! 散点图-相关关系 散点图-相关关系 散点图-一元回归分析 一元线性回归方程 (一)特点 资料估计a、b (1)y主要受x影响,还有其它因素影响; (2)与一元方程不同,是矛盾方程组。 (二)参数估计 最小二乘法、最大似然法 (三)一元回归方程的特点 判定系数 r2 判定系数 r2 回归系数 提出假设 H0: b1 = 0 (没有线性关系) H1: b1 ? 0 (有线性关系) 计算检验的统计量 预测 根据自变量 x 的取值估计或预测因变量 y的取值 估计或预测的类型 点估计 y 的平均值的点估计 y 的个别值的点估计 区间估计 y 的平均值的置信区间估计 y 的个别值的预测区间估计 预测 利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的平均值的一个估计值E(y0) ,就是平均值的点估计。 残差分析 因变量的观测值与根据估计的回归方程求出的预测值之差,用e表示 反映了用估计的回归方程去预测而引起的误差 确定有关误差项?的假定是否成立 检测有影响的观测值 残差分析 表示残差的图形 关于x的残差图 关于y的残差图 标准化残差图 用于判断误差?的假定是否成立 检测有影响的观测值 残差分析 残差分析 如果某一个点与其他点所呈现的趋势不相吻合,这个点就有可能是异常点,或称为野点 如果异常值是一个错误的数据,比如记录错误造成的,应该修正该数据,以便改善回归的效果 如果是由于模型的假定不合理,使得标准化残差偏大,应该考虑采用其他形式的模型,比如非线性模型 如果完全是由于随机因素而造成的异常值,则应该保留该数据 在处理异常值时,若一个异常值是一个有效的观测值,不应轻易地将其从数据集中予以剔除 多元回归模型 一个因变量与两个及两个以上自变量的回归 描述因变量 y 如何依赖于自变量 x1 , x2 ,…, xp 和误差项 ? 的方程,称为多元回归模型 涉及 p 个自变量的多元回归模型可表示为 多元回归模型 误差项ε是一个期望值为0的随机变量,即E(?)=0 对于自变量x1,x2,…,xp的所有值,?的方差?2都相同 误差项ε是一个服从正态分布的随机变量,即ε~N(0,?2),且相互独立 多元回归模型 多元回归模型 多重判定系数 回归平方和占总平方和的比例 计算公式为 因变量取值的变差中,能被估计的多元回归方程所解释的比例 调整后的判定系数 用样本容量n和自变量的个数p去修正R2得到 计算公式为 避免增加自变量而高估 R2 意义与 R2类似 数值小于R2 线性相关? 1. 提出假设 H0:?1??2????p=0 线性关系不显著 H1:?1,?2,?,?p 至少有一个不等于0 单个系数检验 提出假设 H0: bi = 0 (自变量 xi 与 因变量 y 没有线性关系) H1: bi ? 0 (自变量 xi 与 因变量 y有线性关系) 计算检验的统计量 t 多重共线性 回归模型中两个或两个以上的自变量彼此相关 多重共线性带来的问题有 可能会使回归的结果造成混乱,甚至会把分析引入歧途 可能对参数估计值的正负号产生影响,特别是各回归系数的正负号有可能同预期的正负号相反。如水位升高对大坝变形和应力的影响 如何检验是否存在多重共线性? 目前常用的有方差扩大因子法和特征根判定法。下面简单介绍方差扩大因子(VIF)法。 自变量选择原则 准则4(AIC准则) 赤池信息量达到最小 日本统计学家赤池(Akaike)提出,称它为Akaike Information Criterion 简称AIC。 2. 计算检验统计量F 3. 确定显著性水平?和分子自由度p、分母自由度n-p-1找出临界值F ? 4. 作出决策:若FF ?,拒绝H0 Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copy
文档评论(0)