- 1、本文档共31页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
9 9 9 As a result of this class, you will be able to ... As a result of this class, you will be able to ... * 分类数据 分类数据 分类变量的结果表现为类别 例如:性别 (男, 女) 各类别用符号或数字代码来测度 使用分类或顺序尺度 你吸烟吗? 1.是;2.否 你赞成还是反对这一改革方案? 1.赞成;2.反对 对分类数据的描述和分析通常使用列联表 可使用???检验 ?? 统计量 ?? 统计量 用于检验分类变量拟合优度 计算公式为 ?? 统计量 分布与自由度的关系 9.2 拟合优度检验 拟合优度检验(例题分析) 【例】1912年4月15日,豪华巨轮泰坦尼克号与冰山相撞沉没。当时船上共有共2208人,其中男性1738人,女性470人。海难发生后,幸存者为718人,其中男性374人,女性344人,以的显著性水平检验存活状况与性别是否有关。 (? ?0.05) 拟合优度检验(例题分析) 解:要回答观察频数与期望频数是否一致,检验如下假设: H0:观察频数与期望频数一致 H1:观察频数与期望频数不一致 拟合优度检验(例题分析) 自由度的计算为df=R-1,R为分类变量类型的个数。在本例中,分类变量是性别,有男女两个类别,故R=2,于是自由度df=2-1=1,经查分布表, ??(0.1)(1)=2.706,故拒绝H0,说明存活状况与性别显著相关 9.3 列联分析:独立性检验 9.3.1 列联表 9.3.2 独立性检验 列联表(contingency table) 由两个以上的变量交叉分类的频数分布表 行变量的类别用 r 表示, ri 表示第 i 个类别 列变量的类别用 c 表示, cj 表示第 j 个类别 每种组合的观察频数用 fij 表示 表中列出了行变量和列变量的所有可能的组合,所以称为列联表 一个 r 行 c 列的列联表称为 r ? c 列联表 列联表的结构(r ? c 列联表的一般表示) 列(cj) 合计 j =1 j = 2 … i =1 f11 f12 … r1 i = 2 f21 f22 … r2 : : : : : 合计 c1 c2 … n 列(cj) 行(ri) fij 表示第 i 行第 j 列的观察频数 独立性检验(例题分析) 【例】一种原料来自三个不同的地区,原料质量被分成三个不同等级。从这批原料中随机抽取500件进行检验,结果如表9-3所示,要求检验各个地区和原料质量之间是否存在依赖关系? (? ?0.05) 解:H0:地区和原料等级之间是独立的(不存在依赖关系) H1:地区和原料等级之间不独立 (存在依赖关系) ?? 0.05(4)=9.488故拒绝H0,接受H1 ,即地区和原料等级之间存在依赖关系,原料的质量受地区的影响 独立性检验(例题分析) 9.4 列联表中的相关测量 9.4.1 ? 相关系数 9.4.2 列联相关系数 9.4.3 V 相关系数 列联表中的相关测量 品质相关 对品质数据(分类和顺序数据)之间相关程度的测度 列联表变量的相关属于品质相关 列联表相关测量的统计量主要有 ? 相关系数 列联相关系数 V 相关系数 ? 相关系数(correlation coefficient) 测度2?2列联表中数据相关程度 对于2?2 列联表,? 系数的值在0~1之间 ? 相关系数计算公式为 ? 相关系数(原理分析) 一个简化的 2?2 列联表 因素 Y 因素 X 合计 x1 x2 y1 a b a + b y2 c d c + d 合计 a + c b + d n ? 相关系数 (原理分析) 列联表中每个单元格的期望频数分别为 将各期望频数代入 ?? 的计算公式得 ? 相关系数 (原理分析) 将??入? 相关系数的计算公式得 ad 等于 bc , ? = 0,表明变量X 与 Y 之间独立 若 b=0 ,c=0,或a=0 ,d=0,意味着各观察频数全部落在对角线上,此时|?| =1,表明变量X 与 Y 之间完全相关 列联表中变量的位置可以互换,?的符号没有实际意义,故取绝对值即可 列联相关系数(coefficient of contingency) 用于测度大于2?2列联表中数据的相关程度 计算公式为 C 的取值范围是 0?C1 C = 0表明列联表中的两个变量独立 C 的数值大小取决于列联表的行数和列数,并随行数和列数的增大而增大 根据不同行和列的列联表计算的列联系数不便于比较 V 相关系数(V correlation coefficient) 计算公
文档评论(0)