- 1、本文档共34页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
利用回归方程进行估计(P335) 利用回归方程,在给定x的情况下,可以对y的期望值进行点估计或区间估计。 Y期望值的置信区间上下限如下: 利用回归方程进行预测 预测与估计的区别在于 预测是确定一个具体的数值 估计是确定期望值 残差分析 残差是否服从正态分布; 残差是否具有同方差特征; 残差是否存在序列相关特征。 统计学原理 第八章 方差分析与回归 第一节 方差分析 方差分析的概念 比较组间方差是否可以用组内方差来进行解释,从而判断若干组样本是否来自同一总体。 ANOVA:Analysis Of Variance 方差分析可以一次检验多组样本,避免了t检验一次只能比较两组的缺陷。 考察下列例子: 某厂使用四种不同颜色对产品进行包装,经过在五个城市的试销,获得销售数据如下(单位:万盒),试分析包装颜色对于销售量是否有影响。 观察数据的列平均值,列平均值的差异反映出不同颜色包装的销售业绩差异。此时,需要判断这种差异与同一颜色包装在不同城市间的差异相比,是否显著。如果不显著,则这种平均值的差异属于偶然差异。 方差分析的原理 计算观察值的组间方差和组内方差,并计算两者的比值,如果该比值比较小,说明组间方差与组内方差比较接近,组间方差可以用组内方差来解释,从而说明组间差异不存在。 建立原假设 H0:各组平均数相等 构造统计量 F=组间方差/组内方差 在计算组间方差时,使用自由度为(r-1),计算组内方差时,使用自由度为(n-r)。 F满足第一自由度为(r-1),第二自由度为(n-r)的F分布。 若F值大于0.05临界值,则拒绝原假设,认为各组平均数存在差异。 单因素方差分析 使用EXCEL中的数据分析功能,生成方差分析表如下: 其中:组间离差平方和 SSA (Sum of Squares for factor A) =39.084 误差项离差平方和 SSE (Sum of Squares for Error) =76.8455 总离差平方和 SST (Sum of Squares for Total)=115.9295 P-value值为0.000466,小于0.05,所以拒绝原假设。 关系强度 组间方差占总方差的大小。 该数值反映出在总变异中,能够用因素来解释的变异的大小。 双因素方差分析 观察下列销售数据,欲了解包装方式和销售地区是否对于销售业绩有影响,涉及到双因素的方差分析。 此时需分别计算SSA、SSB与SSE之间的比值是否超过临界值。 其中SSE的自由度为 (n-r-k) 调用EXCEL中的双因素方差分析工具,计算方差分析表如下: 其中行差异(地区因素)对于销售无显著影响; 列差异(包装因素)对于销售有显著影响。 第二节 相关分析 变量间的相关性分析 相关关系 变量间存在的不确定的数量关系,称为相关关系 分类变量:列联表分析 顺序变量:Spearman等级相关分析 分类变量与数值变量:方差分析 数值变量:Pearson相关分析 相关系数的计算 总体相关系数与样本相关系数 相关系数的变化形式 相关系数的实质,是两个数的协方差除以各自的标准差。 相关系数的解释 相关系数为正时,说明数据间存在正相关; 相关系数为负时,说明数据间存在负相关。 相关系数的绝对值越大,说明相关性越强。 相关系数的绝对值越接近于0,说明变量间的相关性越弱。 相关系数值最大为+1,最小为-1。相关系数为+1或-1时,表示两组数据之间存在完全的相关性,即函数关系。 相关系数的显著性检验 检验总体相关系数是否为0 原假设为总体相关系数为0。 通过T检验进行判断 注意:相关系数显著并不意味着相关性强。 等级相关(Rank Correlation) 等级相关用于两个定序尺度测量的样本间相关程度的测定。 将两个样本按观察数据的顺序进行配对,分别计算每个数据的秩,将两组样本的秩分别记录为U和V。 如果两个测度完全一致,则U与V的差异应当为0。 计算D=U-V的平方和,该值越大,表明相关性越差。 如下计算斯皮尔曼等级相关系数(Spearman coefficient of rank correlation) 考虑一个两评委对歌手打分的问题,分别按歌手得分的顺序计算U和V,计算R=0.3212。 第三节 线性回归 回归分析的内容 1、通过一组样本数据,确定变量间的函数关系 2、对函数关系进行统计检验 3、通过回归方程,进行估计或预测,并对估计结果的可靠性进行判断。 回归模型 因变量:被解释的变量 自变量:用于解释因变量的其他变量。 误差项:因变量中不能被函数关系解释的部分。 线性回归模型: 线性回归模型的假设 因变量y与自变量x之间存在线性关系; 自变量x的取值是固定的,不具有随机性; 误差项ε相
文档评论(0)