- 1、本文档共31页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第 9 章 分类数据分析 第 9 章 分类数据分析 9.1 分类数据与c2统计量 9.2 拟合优度 检验 9.3 列联分析:独立性检验 9.4 列联分析中应注意的问题 学习目标 1. 理解分类数据与c2 统计量 掌握拟合优度检验及其应用 掌握独立性检验及其应用 掌握测度列联表中的相关性 分类数据 分类数据 分类变量的结果表现为类别 例如:性别 (男, 女) 各类别用符号或数字代码来测度 使用分类或顺序尺度 你吸烟吗? 1.是;2.否 你赞成还是反对这一改革方案? 1.赞成;2.反对 对分类数据的描述和分析通常使用列联表 可使用???检验 ?? 统计量 ?? 统计量 用于检验分类变量拟合优度 计算公式为 ?? 统计量 分布与自由度的关系 拟合优度检验(例题分析) 【例】1912年4月15日,豪华巨轮泰坦尼克号与冰山相撞沉没。当时船上共有共2208人,其中男性1738人,女性470人。海难发生后,幸存者为718人,其中男性374人,女性344人,以的显著性水平检验存活状况与性别是否有关。 (? ?0.05) 拟合优度检验(例题分析) 解:要回答观察频数与期望频数是否一致,检验如下假设: H0:观察频数与期望频数一致 H1:观察频数与期望频数不一致 拟合优度检验(例题分析) 自由度的计算为df=R-1,R为分类变量类型的个数。在本例中,分类变量是性别,有男女两个类别,故R=2,于是自由度df=2-1=1,经查分布表, ??(0.1)(1)=2.706,故拒绝H0,说明存活状况与性别显著相关 列联表(contingency table) 由两个以上的变量交叉分类的频数分布表 行变量的类别用 r 表示, ri 表示第 i 个类别 列变量的类别用 c 表示, cj 表示第 j 个类别 每种组合的观察频数用 fij 表示 表中列出了行变量和列变量的所有可能的组合,所以称为列联表 一个 r 行 c 列的列联表称为 r ? c 列联表 列联表的结构(r ? c 列联表的一般表示) 独立性检验(例题分析) 独立性检验(例题分析) 列联表中的相关测量 品质相关 对品质数据(分类和顺序数据)之间相关程度的测度 列联表变量的相关属于品质相关 列联表相关测量的统计量主要有 ? 相关系数 列联相关系数 V 相关系数 ? 相关系数(correlation coefficient) 测度2?2列联表中数据相关程度 对于2?2 列联表,? 系数的值在0~1之间 ? 相关系数计算公式为 ? 相关系数(原理分析) 一个简化的 2?2 列联表 ? 相关系数 (原理分析) 列联表中每个单元格的期望频数分别为 ? 相关系数 (原理分析) 将??入? 相关系数的计算公式得 列联相关系数(coefficient of contingency) 用于测度大于2?2列联表中数据的相关程度 计算公式为 V 相关系数(V correlation coefficient) 计算公式为 ?、C、V 的比较 同一个列联表,?、C、V 的结果会不同 不同的列联表,?、C、V 的结果也不同 在对不同列联表变量之间的相关程度进行比较时,不同列联表中的行与行、列与列的个数要相同,并且采用同一种系数 列联表中的相关测量(例题分析) 列联表中的相关测量 (例题分析) 本章小结 拟合优度检验 独立性检验 测度列联表中的相关性 As a result of this class, you will be able to ... As a result of this class, you will be able to ... 9 9 9 As a result of this class, you will be able to ... 9 - * 统计学STATISTICS (第五版) 作者:贾俊平,中国人民大学统计学院 作者:中国人民大学统计学院 贾俊平 统计学 9.1 分类数据与列联表 9.1.1 分类数据 9.1.2 c2统计量 9.2 拟合优度检验 9.3 列联分析:独立性检验 9.3.1 列联表 9.3.2 独立性检验 … : … … … : : : : n c2 c1 合计 r2 f22 f21 i = 2 r1 合计 f12 j = 2 j =1 f11 i =1 列(cj) 列(cj) 行(ri) fij 表示第 i 行第 j 列的观察频数 【例】一种原料来自三个不同的地区,原料质量被分成三个不同等级。从这批原料中随机抽取500件进行检验,结果如表9-3所示,要求检验各个地区和原料质量之间是否存在依赖关系? (? ?0.05) 解:H0:地区和原料等级之
文档评论(0)