- 1、本文档共45页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
列联表中的相关测量(一般问题) 品质相关 对品质数据(定类和定序数据)之间相关程度的测度 列联表相关测量的指标主要有 ? 相关系数 列联相关系数 V 相关系数 ? 相关系数(要点) 测度 2?2列联表中数据相关程度的一个量 对于2?2 列联表,? 系数的值在0~1之间 ? 相关系数计算公式为 ? 相关系数(原理分析) 一个简化的 2?2 列联表 因素 Y 因素 X 合计 x1 x2 y1 a b a + b y2 c d c + d 合计 a + c b + d n ? 相关系数(原理分析) 列联表中每个单元格的期望频数分别为 将各期望频数代入 ?? 的计算公式得 ? 相关系数(原理分析) 将??入? 相关系数的计算公式得 ad 等于 bc , ? = 0,表明变量X 与 Y 之间独立 若 b=0 ,c=0,或a=0 ,d=0,意味着各观察频数全部落在对角线上,此时|?| =1,表明变量X 与 Y 之间完全相关 列联表中变量的位置可以互换,?的符号没有实际意义,故取绝对值即可 列联相关系数(要点) 用于测度大于2?2列联表中数据的相关程度 计算公式为 C 的取值范围是 0?C1 C = 0表明列联表中的两个变量独立 C 的数值大小取决于列联表的行数和列数,并随行数和列数的增大而增大 根据不同行和列的列联表计算的列联系数不便于比较 V 相关系数(要点) 计算公式为 V 的取值范围是 0?V?1 V = 0表明列联表中的两个变量独立 V=1表明列联表中的两个变量完全相关 不同行和列的列联表计算的列联系数不便于比较 当列联表中有一维为2,min[(r-1),(c-1)]=1,此时V=? ?、C、V 的比较 同一个列联表,?、C、V 的结果会不同 不同的列联表,?、C、V 的结果也不同 在对不同列联表变量之间的相关程度进行比较时,不同列联表中的行与行、列与列的个数要相同,并且采用同一种系数 列联表中的相关测量(一个实例) 【例】一种原料来自三个不同地区,原料质量被分成三个不同等级。从这批原料中随机抽取500件进行检验,结果如下表。分别计算?系数、C系数和V系数,并分析相关程度 地区 一级 二级 三级 合计 甲地区 52 64 24 140 乙地区 60 59 52 171 丙地区 50 65 74 189 合计 162 188 150 500 列联表中的相关测量(一个实例) 解:已知n=500,根据前面的计算??=19.82,列联表为3?3 结论:三个系数均不高,表明产地和原料等级之 间的相关程度不高 * X2分布的期望值准则 利用X2分布进行检验时,要求样本容量必须足够大,特别是每个单元中的期望频数不能过小,否则应用X2检验可能会得出错误的结论。 一项准则是:如果只有两个单元,每个单元的期望频数必须是5或以上。 另一准则是:如果有两个以上的单元,如果20%的单元期望频数小于,则不能应用X2检验。 * X2分布的期望值准则 例如表中的数据可以计算,因为6个单元中只有1个单元的期望频数小于5。 类别 f0 fe A B C D E F 28 49 18 6 92 20 26 47 23 4 88 25 合计 213 213 * X2分布的期望值准则 但是表中的数据不能应用检验。 类别 f0 fe A B C D E F G 30 110 86 23 5 5 4 32 113 87 24 2 4 1 合计 263 263 * X2分布的期望值准则 如果我们仔细观察会发现,表中的f0与fe非常接近,最大的差别只是3,应当说期望值与观察值拟合得很好,它们之间并无显著差别。 然而,用X2检验得到的结果却是拒绝原假设,差异显著。 解决的方法是:将小单元合并,使得fe大于5。 3 9 As a result of this class, you will be able to ... 第九章 分类数据分析 第九章 列联分析 变量之间的关系: 1.定性变量之间的关系 2.定性变量与定量变量之间的关系. 3.定量变量与定量变量之间的关系. 数据的类型与列联分析 数 据 定量数据 (数值型数据) 分类数据 (品质数据) 离散数据 连续数据 列联分析 分类数据 分类(品质)的随机变量的结果表现为类别 例如:性别 (男, 女) 各类别用符号或数字代码来测度 使用定类或定序尺度 你吸烟吗? 1.是;2.否 你赞成还是反对这一改革方案? 1.赞成;2.反对 对分类数据的描述和分析通常使用列联表 可使用???检验 交叉分组 一分公司 二分公司 三分公司 四分公司 合计 赞成该方案 68 75 57 79 279 反对该方案 32 75 33 31 141 合计 100 120 90
文档评论(0)