卡方检验()剖析.ppt

  1. 1、本文档共72页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第六章  ?2 检 验 一、?2分布的定义   ?2分布是从正态分布派生出来的一个连续型分布,与正 态分布和t分布关系密切。下面的定理清楚地表明了其间的关 系。   定理1: 设Z1,…., Zn 是n 个独立的标准正态变量N(0 1), 则其平方和       服从自由度为n的?2 分布。   推论1: 标准正态变量Z的平方服从自由度为1的?2 分 布。即:Z2 =?2 (1) 在定理中令n=1 即得此推论。 二、?2分布的性质 1、?2 分布的概率密度函数f(?2 ,?)的图形见下图。 特点: (1) 自由度? 越大,曲线越趋近于对称; (2) 当自由度???,?2 分布趋向正态分布。 2、若 ?2 ,则 E(X)= ?, Var(X)=2? 3、?2 分布具有可加性。 若 X1? ?2 X2 ? ?2 , 且 X1 与 X2 独立, 则(X1+X2)? ?2 检验的基本思想 以两样本率比较的检验为例,介绍 检验的基本思想。 分布是一种连续型分布 分布的形状依赖于自由度的大小, 当自由度≤2时,曲线呈L型;随着的增加,曲线逐渐趋于对称; 当自由度→∞时, 分布趋向正态分布。 分布的具有可加性。 1.独立性假设与理论频数计算 在对2?2表作统计处理之前,通常都有一个笼统的检 验假设,即属性A与B 相互独立。为便于理解这个独立性假 设,不妨给上表赋予实际内容。以研究吸烟与肺癌的关系 为例,设 A 代表“吸烟与否”, A1=“吸烟”, A2=“不吸烟”, B 代表“患肺癌与否”,B1=“患肺癌”, B2=“未患肺癌”。 于是,A与B 相互独立,就意味着吸烟与肺癌无关联。 吸烟与不吸烟患者患肺癌的概率应当相等, 即 P(B1/A1)= P(B1/A2)=P(B1)=a+c/n 而 吸烟者出现的概率 P(A1)= a+b/n, 不吸烟者出现的概率 P(A2)= c+d/n, 故 吸烟者同时患有肺癌的概率为: P(A1 B1)= P(A1) P(B1/ A1) 公式 P(A1 B1)= P(A1) P(B1)=(a+b)/n×(a+c)/n 故在前述独立性假设检验的前提下,与观察频数a对应的理论频数为: 式中TRC为第R(row)行、第C(column)列的理论频数,nR为相应行的合计,nc为相应列的合计,n为总例数. 基本公式(亦称Pearson ) 值反映了实际频数与理论频数的吻合程度,其中 反映了某个格子实际频数与理论频数的吻合程 度。若检验假设 成立,实际频数与理论频数的差值小, 则 值也会小;反之,若检验假设不成立,实际频数与理 论频数的差值会大,则 值也会大。 值的大小还取决于 个数的多少(严格地说是自由度的大小)。 K.Pearson (1899)提出的拟合优度检验是用来检验实际观察数于依照某种假设或模型计算出来的理论数之间的一致性,以便判断该假设或模型是否与观察数相配合。 包括两种类型: 1、检验观察数与理论数之间的一致性。 2、通过检验观测数与理论数之间的一致性来判断 事物之间的独立性。 Pearson 拟合优度(goodness of fit test )?2 检验 由于各 皆是正值,故自由度愈大, 值也会愈大;所以只有考虑了自由度的影响, 值才能正确地反映实际频数和理论频数的吻合程度。 检验时,要根据自由度查界值表。当 ≥ 时, 拒绝 ,接受 ;当 ≤ , 时,尚没有理由拒绝 。 检验的自由度取决于可以自由取值的格子数目,而不是样本含量n。四格表资料只有两行两列,自由度(df)=1,即在周边合计数固定的情况下,4个基本数据当中只有一个可以自由取值. 自由度=(行数-1)(列数-1) 2χ2 表的计算 (1) 当n?40, Tij? 5的条件下 可用下列简化公式 例1 工农业高血压患病率的比较(50岁以上男性),首钢调查50-59岁男性工人1281人、高血压患者386人,患病率为30.13%。石景山区农民387人,血压血患者65人,患病率为16.80%,从事工农业生产的男性患病率有无差别。 解: ① 建立检验假设 H0:π1 =π2 (工人与农民的总体患病率相同) ?=0.05 估计总体某现象的

文档评论(0)

金不换 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档