《第十讲列联表》PPT课件.pptVIP

  1. 1、本文档共41页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《第十讲列联表》PPT课件

第十讲 列联表 第一节 概念 1、研究内容 1)研究两定类变量的关系 2)为研究y的分类是否与x之分类有关,将数据先按x分类,再分别统计x分类情况下y的分类。 3)按两个定类变量进行交叉分类的频次分配表,即二维列联表。 4、列联表的一般形式 Nij:x=xi y=yj时所具有的频次 学生上网调查 (统计各项比例,能发现什么问题?) 2、列联表中变量的分布 1)联合分布 对于二变量来说,为了知道分布,集合中的变量值,必须同时具有x和y两个变量的取值。 ( x1 y1 N11) ( x2 y2 N12) ( x1 yr N1r) 此称联合分布 ( xi yj Nij) ( xc yr Ncr) Nij 表示频次时 联合频次分布表 表示概率时 联合概率分布表 后者可以通过前者求出 2)边缘分布: 对联合分布进行简比,只研究其中某一变量的分布,而不管另一变量的取值,这样就得到边缘分布。 按行加总 y的边缘分布: 按列加总 x的边缘分布: 3)条件分布: 将其中一个变量控制起来取固定值,再看另一变量的分布,即条件分布。 控制x时,条件分布中的每一项都以边缘分布的 为分母 控制y时,条件分布中的每一项都以边缘分布的 为分母 3、列联表中的相互独立性: 1)列联表研究定类变量之间的关系,实际上是通过条件分布的比较进行的。 如果两个变量之间没有关系,则称变量之间是相互独立的。 2)如果两个变量之间是相互独立的,则必然存在变量的条件分布与其边缘分布相同 。 条件分布=边缘分布 是列联表检验的基础: (控制x时) 第二节 列联表的检验 一、原假设: 将总体中变量间无关系或相互独立作为检验的原假设。 总体 和 未知时,用样本 和 代替。 二、统计量 ~ 统计量的讨论 1、对于2×2列联表,由于格数过少,为减少作为离散观测值与作为连续型变量x值之间的偏差,可作连续性修正: 2、二项总体 统计量 为总体成数 男女休闲爱好 对开卷考试的看法 3、对多项总体: 统计量: ~ 4、使用统计量 对列联表进行检验,每一格值的 要保持在一定数目之上。如果有的格值 过小,那么在计算 值时 值的波动就会较大。 每格要求: 处理方法: 将期望值偏小的格值合并 右例,做检验。 注意: 列联表就其检验内容来看是双边检验,但从形式上看,却又很像单边检验。其判断的内容仅是变量间似乎否存在关系。至于方向,由于列联表属定类变量,因此是不存在的。 列联表检验步骤 1、 2、统计量: ~ 3、 4、比较 例:以下是老、中、青三代对某影片的抽样,能否认为三代人对该影片评价有显著差异 第三节 列联强度 一、变量间的相关 1、列联表中的频次分布情况,不仅是检验是否存在关系的依据,同时也是度量变量间关系强弱的依据。相关性程度越高,说明社会现象与社会现象间的关系愈密切。 2、列联表中变量间的关系的强度分析,可以将频次转化为条件分布,然后比较自变量取不同值时,因变量条件分布的不同。 例 右表中,男生上网玩游戏的比例高于女生;而上网聊天的比例低于女生; 想一想,当x取值大于2时,怎样比较? 二、2×2表—— 系数和Q系数 列联表中两个变量都只有二种取值时,就是2×2表 当变量间无关系时(独立) 对于2×2表,无论 系数或Q系数,都以差值 为基础进行讨论,同时,也把关系强度的取值范围定义在 之间。 1、 系数 ——当两变量相互独立 ——b、c为零, 值最大1 a、d为零, 值最小-1 ——一般情况 前例中计算

文档评论(0)

wuyoujun92 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档