- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第七章方差分析.
第七章 方差分析
方差分析(analysis of variance)是检验多个总体均值是否相等的统计方法。目的:通过检验多个总体的均值是否相等来判断定类变量对定距变量是否有显著影响。
第一节 方差分析引述
一、方差分析的基本思想和原理
例1:想了解四个行业的服务质量如何,得到以下数据:
消费者对四个行业的投诉次数
观测值 行业 零售业 旅游业 民航业 制造业 1 57 68 31 44 2 66 39 49 51 3 49 29 21 65 4 40 45 34 77 5 34 56 40 58 6 53 51 7 44 自变量行业是分类变量,因变量被投诉次数是定距变量。
想知道行业对被投诉次数的影响,就要分析不同行业的被投诉次数之间是否有显著差异,即检验四个行业被投诉次数的总体均值是否相等(注意不是样本均值)。如果相等,行业对投诉次数无影响;如果均值不全相等,有影响。
为什么不用均值检验的方法?
均值检验一次只研究两个样本,要检验4个总体均值是否相等,需要6次检验(1-2,1-3,1-4,2-3,2-4,3-4)。每次检验犯第一类错误的概率是α,作多次检验会增加犯错概率和降低置信水平。而方差分析同时将所有样本信息结合在一起,增加了分析的可靠性,降低了犯错的概率,避免拒绝真实的原假设。
如何用样本均值检验总体均值即判断行业对投诉次数是否有影响?
各行业被投诉次数的样本均值不相等,是否可说明不同行业被投诉次数有明显差异?不一定,也许各行业总体均值无差异,仅仅因为抽样的随机性造成了彼此之间的差异/随机误差。(来自同一个总体的各个样本之间因为随机性而造成的均值差异和来自不同总体的样本之间的均值差异在散点图上是有差异的。)
所以,方差分析就是对于差异来源进行分析(来源于随机误差还是不同总体间的真实差异),从而判断不同总体均值是否相等。
在例1中,在同一行业(同一总体)下,样本的各观测值不同,其差异可看作抽样的随机性造成的,称之为随机误差。在不同行业(不同总体)下,各观测值也是不同的,这种差异可能是由于抽样的随机性造成的,也可能是由于行业本身的不同而造成的系统误差。
衡量同一行业下样本数据的误差,称为组内误差;衡量不同行业下样本之间的误差,称为组间误差。组内误差只包括随机误差,组间误差既包括随机误差也包括系统误差。如果行业对投诉次数没有影响,组间误差里就只包含随机误差而没有系统误差。这时,组间误差与组内误差的比值应接近1;反之,如果行业对投诉次数有影响,组间误差中除随机误差外还有系统误差,组间误差与组内误差之比就应该大于1。当这个比值达到某种程度时,就可以说不同行业的投诉次数之间有显著差异,即行业对投诉次数有显著影响。
二、方差分析的基本假定
1、自变量每一个取值对应的分布都应服从正态分布,以例1为例,每个行业的投诉次数都应服从正态分布。
2、自变量每一个取值对应的分布都应有相等的方差,即自变量的各组数据是从具有相同方差的正态总体中抽取的。注意,仅要求总体方差相等,而非样本方差。通常自变量各组数据的样本方差中最大值不超过最小值的二三倍,就可以视为等总体方差。
3、观测值是独立的。每个被抽中企业被投诉次数与其它企业被投诉次数的次数是独立的。
三、问题的提法
设自变量共有m类,每类的总体均值分别用μm表示,要检验m类总体均值是否相等,需要提出以下假设:
H0:μ1=μ2=….=μm, 自变量对因变量没有显著影响
H1:至少有一个以上的类别均值不等或μ1、μ2….μm不全相等。
第二节 一元方差分析
分析一个分类型自变量对数值型因变量的影响时使用一元方差分析/单因素方差分析。
一、数据结构
设自变量A共分m类,A1,A2,..,Am。现从A1类中随机抽取n1个,A2类中随机抽取n2个,……,从Am类中随机抽取nm个(n1, n2,…nm可以不等),根据各个观测值可得到如下统计表:
A1 A2 …… Am y11 y21 . ym1 y12 y22 . ym2 … … . … . . 二、分析步骤
1、提出假设
2、构造检验统计量
(1)计算各样本均值
(2)计算全部观测值的总均值
观测值 行业 零售业 旅游业 民航业 制造业 1 57 68 31 44 2 66 39 49 51 3 49 29 21 65 4 40 45 34 77 5 34 56 40 58 6 53 51 7 44 样本均值 =49 =48 =35 =59 样本容量 7 6 5 5 总均值 ==≈47.9 (3)计算误差平方和
①总误差平方和TSS:全部观测值与总均值的误差平方和,反映了全部观测量的离散状况,
TSS=;
根据例1计算:TSS=(57-47.9)2
您可能关注的文档
- 第4章第七节涡流电磁阻尼和电磁驱动练习题及答案解析..doc
- 第4章管理道德与社会责任..doc
- 第4章子程序设计和DOS功能调用..doc
- 第4节能量之源光与光合作用..doc
- 第4章静电场..doc
- 第4节药物相互作用..docx
- 第5单元教案..doc
- 第5单元遨游汉字王国..doc
- 第5章3固定资产业务..doc
- 第5章光学系统象质检验与评价1..doc
- GB/T 18282.1-2025医疗保健产品灭菌 化学指示物 第1部分:通则.pdf
- 《GB/T 18282.1-2025医疗保健产品灭菌 化学指示物 第1部分:通则》.pdf
- 市交通运输局局长2025年专题生活会对照“四个带头”含落实意识形态工作责任制方面个人对照检查发言提纲与乡镇(街道)围绕“四个带头”主题领导班子检视问题整改方案【2篇文】.docx
- 2025年市红十字会党支部书记、团市委党支部书记组织生活会“四个带头”个人对照检查发言材料【含意识形态工作责任制落实方面】2篇文.docx
- 市水利局党支部书记2025年组织生活会对照“四个带头”个人发言材料(含意识形态工作责任制落实方面)与市委领导班子围绕“四个带头”生活会查摆问题整改方案2篇文.docx
- 检察院领导班子2025年专题生活会对照“四个带头”检查材料与市民族宗教事务局党组书记、局长围绕“四个带头”生活会对照检查材料【含反面典型案例剖析】2篇文.docx
- 对照“四个带头”重点方面含反面典型案例查摆的问题解析生活会个人对照检查发言稿与市交通运输局局长“四个带头”含落实意识形态工作责任制方面个人对照检查发言提纲【2篇文】.docx
- 市水利局党支部书记2025年组织生活会对照“四个带头”个人发言材料(含意识形态工作责任制落实方面)与纪检委员“四个带头”方面个人对照检查材料【2篇文】.docx
- 2025年市中级人民法院领导班子、市投资促进局党支部书记对照“四个带头”方面生活会检视剖析材料(含典型案例剖析、意识形态)2篇文.docx
- 医院党委领导班子2025年检视问题整改落实方案与对照“四个带头”方面含反面典型案例查摆的问题解析生活会个人对照检查发言稿【2篇文】.docx
文档评论(0)