网站大量收购独家精品文档,联系QQ:2885784924

统计学列联分析.ppt

  1. 1、本文档共60页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计学列联分析.ppt

数据 As a result of this class, you will be able to ... 9 9 9 As a result of this class, you will be able to ... 拟合优度检验 (例题分析) H0:地区与原料等级之间独立 H1:地区与原料等级之间不独立 ? = 0.05 df = (3-1)(3-1)= 4 临界值(s): 统计量: 在 ? = 0.05的水平上拒绝H0 地区和原料等级之间存在依赖关系 决策: 结论: 9.3 列联表中的相关测量 9.4.1 ? 相关系数 9.4.2 列联相关系数 9.4.3 V 相关系数 列联表中的相关测量 品质相关 对品质数据(分类和顺序数据)之间相关程度的测度 列联表变量的相关性属于品质相关 列联表相关测量的统计量主要有 ? 相关系数 列联相关系数 V 相关系数 ? 相关系数 (correlation coefficient) 测度2?2列联表中数据相关程度 对于2?2 列联表,? 系数的值在0~1之间 ? 相关系数计算公式为 ? 相关系数 (原理分析) 一个简化的 2?2 列联表 因素 Y 因素 X 合计 x1 x2 y1 a b a + b y2 c d c + d 合计 a + c b + d n ? 相关系数 (原理分析) 列联表中每个单元格的期望频数分别为 将各期望频数代入 ?? 的计算公式得 ? 相关系数 (原理分析) 将??入? 相关系数的计算公式得 ad 等于 bc , ? = 0,表明变量X 与 Y 之间独立 若 b=0 ,c=0,或a=0 ,d=0,意味着各观察频数全部落在对角线上,此时|?| =1,表明变量X 与 Y 之间完全相关 列联表中变量的位置可以互换,?的符号没有实际意义,故取绝对值即可 当列联表中行数和列数大于2时, ? 相关系数将会随着R和C的增大而增大, ? 值没有上限,描述相关程度不够清晰。 列联相关系数 (coefficient of contingency) 用于测度大于2?2列联表中数据的相关程度 计算公式为 C 的取值范围是 0?C1 C = 0表明列联表中的两个变量独立 C 的数值大小取决于列联表的行数和列数,并随行数和列数的增大而增大 根据不同行和列的列联表计算的列联系数不便于比较-----局限性 V 相关系数 (V correlation coefficient) 计算公式为 V 的取值范围是 0?V?1 V = 0表明列联表中的两个变量独立 V=1表明列联表中的两个变量完全相关 不同行和列的列联表计算的列联系数不便于比较 当列联表中有一维为2,min[(r-1),(c-1)]=1,此时V=? ?、C、V 的比较 同一个列联表,?、C、V 的结果会不同 不同的列联表,?、C、V 的结果也不同 在对不同列联表变量之间的相关程度进行比较时,不同列联表中的行与行、列与列的个数要相同,并且采用同一种系数 列联表中的相关测量 (例题分析) 【例】一种原料来自三个不同地区,原料质量被分成三个不同等级。从这批原料中随机抽取500件进行检验,结果如下表。分别计算?系数、C系数和V系数,并分析相关程度 地区 一级 二级 三级 合计 甲地区 52 64 24 140 乙地区 60 59 52 171 丙地区 50 65 74 189 合计 162 188 150 500 列联表中的相关测量 (例题分析) 解:已知n=500,??=19.82,列联表为3?3 结论:三个系数均不高,表明产地和原料等级之 间的相关程度不高 §9.4 列联分析中应注意的问题 §9.4.1条件百分表的方向 §9.4.2 分布的期望值准则 * § 9.4.1条件百分表的方向 条件百分表方向 一般在列联表中变量的位置是任意的,即既可以把变量X放在列的位置,也可以放在行的位置。如果变量X与Y存在因果关系,令X为自变量(原因),Y为因变量(结果),那么一般的做法是把自变量X放在列的位置,条件百分表也多按自变量的方向计算,因为这样便于更好地表现原因对结果的影响。如有下面的一个2*2列联表。 * § 9.4.1条件百分表的方向 表9-12 职业背景与工作价值观取向 * § 9.4.1条件百分表的方向 表9-12 分析 数据显示,总共调查了225人,其中制造业145人,服务业80人; 在制造业被调查者中,以物质报酬为价值取向的有105人,占该群体的72%; 以人情关系为价值取向的有40人,占该群体的28%。而服务业被调查者中,以物质报酬为价值取向的有45人,占该群体的56%; 以人情关系为价值取向的有35人,占该群体的44%; 数据表明,与制

您可能关注的文档

文档评论(0)

weiwoduzun + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档