统计学第10章方差教材分析.doc

  1. 1、本文档共24页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第10章 方差分析 适用:多个均值是否相等的检验(分类数据与数值型数据) 10.1 方差分析引论 例 消费者与产品生产者、销售者或服务的提供者 之间经常发生纠纷。当纠纷发生后,消费者通常会向消费者协会投诉。为了对几个行业的服务质量进行评价,消费者协会在零售业、旅游业、航空公司、家电制造业分别抽取了一些 企业作为样本。其中零售业7家、旅游业6家、航空公司5家、家电制造业5家。每个行业所抽取的这些企业,假定他们在服务对象、服务内容、企业规模等方面基本相同。然后统计最近一年中消费者对这23家企业的投诉次数,结果如下表: 零售业 旅游业 航空公司 家电制造44 57 68 31 51 66 39 49 65 49 29 21 77 40 45 34 58 34 56 40 53 51 44 消费者协会想了解这几个行业之间的服务质量是否有显著性差异。 10.1.1 分析 服务质量 显著性差异 投诉次数 均值不相等 转化为数学表达: 没有显著性差异 上面的等式不全相等 有显著性差异 一般假设检验的解决方法: 更好的方法:方差分析 没有显著性差异不同的行业服务质量一样,行业对服务质量没有显著影响 有显著性差异不同的行业服务质量不一样,行业对服务质量有显著影响 从行业对服务质量影响的角度来分析平均服务质量的差异问题 术语: 因素:一个独立的随机变量,是方差分析研究的对象———— 企业所属行业类型 水平:因素的内容————各个行业: 零售业、旅游业、航空公司、家电制造 10.1.3 方差分析的原理: 1 观察值之间差异的原因 A 由于选取样本的随机性引起的差异 B 由于因素中的不同水平形成的差异——系统性差异 (行业不同,服务质量不同) 2 水平内部与水平之间差异的类型 A 水平内部的差异 只包含随机性差异 (同行业企业服务质量的差异) B 水平之间的差异 既包含随机性差异又包含系统性差异 (不同行业企业服务质量的差异) 3 原理 如不同的水平对结果没有影响 则水平之间的差异应只包含随机性差异 与水平内部的差异应该非常接近 反之 如不同的水平对结果产生影响 则水平之间的差异应既包含随机性差异又包含系统性差异 应该大于水平内部的差异 所以,可以通过比较这两个差异的大小 当比较的结果大于某个临界值时,就可以判定水平之间包含系统性差异, 即水平对结果有显著影响——均值不全相等 10.1.4 技术问题 选择什么样的指标来衡量这两个差异与比较的结果 差异:离散——离差平方和 差异的比较:差、商——考虑统计量的分布与临界值 方差分析的基本假定 ① 每个总体都服从正态分布,即对于因素的每一个水平,其观测值都是来自正态总体的简单随机样本; ② 各个总体的方差相等 ③ 观测值是独立的 ——独立等方差的正态总体 实际应用中近似满足即可 10.2 单因素方差分析 单因素方差分析:分析只针对一个因素进行 企业类型 双因素方差分析:分析针对两个因素进行 企业类型 企业文化 10.2.1分析步骤 1 提出假设 因素(自变量)对结果(因变量)没有显著性差异 不全相等 自变量对因变量有显著性差异 上例: 不同行业对服务质量没有显著性差异 上面的等式不全相等 不同行业对服务质量有显著性差异 2 计算均值 ① 计算各样本的均值 设从第个总体中抽取一个样本容量为的简单随机样本, 令为其均值,则 其中,为第个总体的第个观察值 为因素水平的个数(总体的个数) 上例:, ,, ②计算全部观测值的总均值 上例: 3计算各误差平方和 A 组内平方和 是每个水平或组的各样本数据与其组均值误差的平方和 反映了各个样本观测值的离散状况 上例: B 组间平方和 是各组均值与总平均的误差平方和 反映各组的差异 上例: C 总平方和 是全部观测值与总平均的误差平方和 上例: 4计算统计量 定理: 当各总体满足方差分析的三个基本假设时,有 ,相互独立 且 当成立时, 所以,为了检验 取检验统计量为 上例: 5统计决策: 大于 拒绝原假设 —————— 右单侧检验 所以 当 ,拒绝原假设 当 ,不能拒绝原假设 上例: 临界值 因为3.413.13, 所以拒绝原假设,即认为服务质量均值有显著性差异,行业类型对服务质量有显著性影响。 方差分析表 误差来源 平方和 自由度 均方 值 值 临界值

您可能关注的文档

文档评论(0)

挑战不可能 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档