第七讲卡方检验和方差分析.ppt

  1. 1、本文档共26页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第七讲 卡方检验和方差分析 一、卡方检验 1. 拟合优度检验 1)指定分布率的拟合优度检验 2)理论概率分布的拟合优度检验 2. 独立性检验 1)列联表 2)独立性检验 第七讲 卡方检验和方差分析 二、方差分析 1. 方差分析的基本思想和原理 1) 处置的概念 2)平方和与均方和 3)F分布曲线 4)方差分析中的基本假设 2. 单因素方差分析的程序 3. 单因素方差分析方法的应用 F分布 方差分析的前提条件和程序 假定前提: (1)各总体都服从正态分布; (2)各总体方差相等; (3)样本间相互独立。 程序: (1)提出假设; (2)根据指定的显著水平和观察值总数目、处置数目确定拒绝的最小F 值; (3)求出SSC和SSE,计算样本F 值; (4)比较检验统计量,得出结论 。 假定前提: (1)各总体都服从正态分布; (2)各总体方差相等; (3)样本间相互独立。 程序: (1)提出假设; (2)根据指定的显著水平和观察值总数目、处置数目确定拒绝的最小F 值; (3)求出SSC和SSE,计算样本F 值; (4)比较检验统计量,得出结论 。 一电台想了解在加利福尼亚州的三个不同城市观众的收视习惯方面是否存在差异。调研者随机从三个城市分别抽出5人组成随机样本,要求每组人员报出其上周收看电视所花的时间(小时),数据见表内。取显著系数0.05,试问他能否得出三个城市在收看电视上所花的时间方面存在差异吗? * * ?18.307 0. 05 ? 已知自由度=10,右尾面积=0.05,求卡方变量值,用EXCEL函数 CHIINV(右尾面积,自由度) 本例有 18 ?0.5496 ? 已知自由度=10,卡方变量值=18,求右尾面积,用EXCEL函数 CHIDIST(变量值,自由度) 本例有 如果拟定假设为真,则各类农户的期望频数如下: 自由度=分类数 - 1 D3:D5=B3:B5*$B$6 EXCEL的chitest函数计算卡方统计量后直接报告P值。 由于P值非常小,有足够的信心拒绝拟定假设。 C5:c8=binomdist(b5:b8,$b$2,$b$4,false) D5:d8=c5:c8*$b$9) 你将得出什么结论? H0:行车意外独立于手机使用情况。 H1:行车意外与于手机使用情况有关。 B11=B6*$E$4/$E$6,拖动到C11,D11。 B12=B6*$E$5/$E$6,拖动到C12,D12。 对话框内填入什么? 这是什么数值? 本检验自由度是多少? 本检验的结论是什么? 从样本数据看,三家公司得分是有差别的。那么,只是否能说明总体上得分不一致呢? 或者说,样本数据反映的是随机误差还是本质上的不同呢? 也可以问:三组数据是来自一个总体,还是来自平均数不等的三个总体呢? 处置间差异 处置间差异 ? 处置1 ? ? X11 X21 X21 X21 X21 处置内差异 X12 X22 X32 X42 X52 处置内差异 X13 X23 X33 X43 X53 处置内差异 ? 如果处置间差异显著地大于处置内差异, 则认为各样本所来自的总体并非具有相等的平均数 ? ? ? 处置2 处置3 差异的表述 绝对差异的表述:(离差)平方和 相对差异的表述:均方和=(离差)平方和 除以自由度 处置(列)间平方和 SSC= 处置(列)内平方和 总平方和 SS 总自由度: n-1 处置(列)间自由度:ν1=k-1 处置(列)内自由度:ν2=( n-1)-( k-1)= n-k 处置(列)间均方和 : MSC= 处置(列)内均方和: 方差分析的逻辑 零假设:各样本(处置结果)来自平均数相等的总体。 若要推翻以上假设,则处置间差异必须显著地大于处置内差异。两者对比采用列间均方和与列内均方和的比值形式表示。即:若要推翻以上假设,则此比值必须“显著地大”。 此比值服从以ν1和ν2为自由度的F分布。所谓“比值显著地大”,就是超过指定显著系数所对应的F分布临界值。 α Fα Fν1,ν2 临界值 比值显著地大 比值与1无显著差异 两个独立的 t分布被各自的自由度去除,所得之商的比率服从F分布.它是一种非对称分布,图形的形状取决于分子和分母的自由度. F分布的图形 F P F(10,4) F(10,10) F(10,50) 一向方差分析的方差分析表 MSC/MSE SST n-1 总 MSE=SSE/(n-k) SSE n-k 误 差 MSC=SSC/(k-1) SSC k-1 处 置 P-值

文档评论(0)

junjun37473 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档