列联表中的相关性测量 (2).docVIP

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
列联表中的相关性测量 列联表相关测量的有关问题 一、交互分类和列联表 来自某个总体的样本,同时按两个或两个以上的标准进行分类。分类的资料可以排列成一个行、列交织的表,称为列联表,也叫交互分类表。如: 妇女的教育水平与志愿 愿 望(Y) 教育水平(X) 合计 高 低 幸福家庭 125 95 220 理想工作 65 105 170 合 计 190 200 390 列联表可以清楚反映在X变化的条件下,Y的次数分布情况。因此,列联表又称为条件次数表。 列和:行边缘次数 行和:列边缘次数 表中的次数:条件次数,表示在自变量的每个条件,因变量各个值的数目。 … 合计 … … ┇ … … 合计 … 二、条件频率 妇女的教育水平与志愿(%) 愿 望(Y) 教育水平(X) 高 低 幸福家庭 65.79 47.50 理想工作 34.21 52.50 100.00 100.00 愿 望(Y) 教育水平(X) 高 低 幸福家庭 56.82 43.18 100.00 理想工作 38.24 61.76 100.00 第二节 McNmar检验 这种检验方法适用于非独立样本的2*2表 Cochran检验是该检验方法在多样本条件下的推广。 例 为了评估一位政党候选人竞选活动的效果,由60个选民组成的随机样本在候选人演说之前和之后,询问的问题是“对该候选人是投赞成还是反对” 受试者 演说前 演说后 受试者 演说前 演说后 受试者 演说前 演说后 1 1 1 21 0 1 41 1 1 2 1 1 22 1 1 42 0 0 3 1 0 23 0 0 43 1 1 4 0 1 24 1 1 44 0 0 5 0 1 25 0 0 45 1 1 6 0 0 26 1 1 46 1 1 7 1 1 27 0 0 47 0 1 8 0 1 28 1 1 48 0 0 9 1 1 29 0 0 49 0 1 10 0 1 30 1 1 50 1 1 11 0 0 31 1 1 51 0 0 12 1 1 32 0 0 52 0 1 13 0 1 33 1 1 53 1 1 14 1 1 34 0 0 54 0 0 15 0 1 35 1 1 55 1 1 16 1 0 36 0 0 56 0 0 17 0 1 37 1 1 57 0 0 18 0 1 38 0 1 58 0 0 19 1 1 39 1 1 59 1 1 20 0 0 40 0 0 60 0 0 后(-) 后(+) 前(+) 2 25 前(-) 20 13 McNmar检验思路: 在竞争演说前后有15个人改变了观点,我们分析的焦点在改变了观点的15个人。 竞争演说无效应 竞争演说有效应 在原假设为真的条件下,认为n个人改变观点的人是随机的选择“+”或“-”。可以认为,选择“+”的人数是服从B(n,0.5)分布。(n为前后改变了选择的样本点)。 则检验的p值: =0.000488 或 故拒绝原假设,竞争演说有显著的正效应。 注:当样本容量(改变观点或发生改变)大于50 时,可以将检验用于McNmar检验。 后(-) 后(+) Σ 前(+) a b a+b 前(-) c d c+d ? a+c b+d a+b+c+d 因为 而 在原假设为真时,,则上式为 等价的公式为 当,则拒绝原假设。 第三节 列联表中的检验及相关测量 四格表资料的χ2检验 (两个样本率比较) 两因素两水平,两因素是否相互独立。 两个样本率资料的四格表形式 x Σ y a b a+b c d c+d ? a+c b+d a+b+c+d 如果X与Y相互没有关系,有 a?[(a+b)(a+c)/(a+b+c+d)]=e11 b?[(a+b)(b+d)/(a+b+c+d)]=e12 c?[(a+c)(c+d)/(a+b+c+d)]=e21 d?[(b+d)(c+d)/(a+b+c+d)]=e22 故设计统计量 2、χ2检验的基本思想 χ2值反映了实际频数和理论频数的吻合程度。χ2值越小,说明实际频数与理论频数越吻合,χ2值越大,说明实际频数与理论频数差异越大。如果检验假设成立,则实际频数与理论频数之差一般不会很大,即出现大的χ2值的概率是小的。若在无效假设下,出现了大的χ2值的概率P≤α(检验水准),我们就怀疑假设的成立,因此拒绝它。另外χ2值的大小,还与自由度有关。故考虑χ2值大小的意义时要同时考虑自由度。 行(r)×列(c)表资料的χ2检验 两因素多水平的情形。 1、如果x与y相互独立,则有 ,所以有 χ2

文档评论(0)

kfuz777 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档