第九章统计学列联分析解读.ppt

  1. 1、本文档共67页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第 九章 列联分析 9.1 分类数据与列联表 9.2 c2 检验 9.3 列联表中的相关测量(自学) 学习目标 1. 解释列联表 进行 c2 检验 拟合优度检验 3. 测度列联表中的相关性 性别与是否逃课有关系吗? 读完四年大学,一次课也没有逃过,这样的学生恐怕不多 2004年5月,中国人民大学财政金融学院的3名学生就逃课问题做了一次调查。调查的对象是财政金融学院的大一,大二,大三本科生。样本的抽取方式是分层抽样与简单随机抽样结合,先根据年级划分层次,然后对各个班级简单随机抽样,共抽取150名学生组成一个样本,并对每个学生采用问卷调查。问卷内容包括每周逃课次数、所逃课程的类型(选修课、专业课等等)和逃课原因等。调查得到的男女学生逃课情况的汇总表如下 性别与是否逃课有关系吗? 这里涉及到两个分类变量,一个是逃课情况,一个是性别 根据上面的数据,你认为性别与逃课与否有关系吗?如何来检验两个分类变量之间是否存在关系呢? 学完本章内容就很容易解决这样的问题 分类数据与列联表 分类变量的结果表现为类别 例如:性别 (男, 女) 各类别用符号或数字代码来测度 使用分类或顺序尺度 你吸烟吗? 1.是;2.否 你赞成还是反对这一改革方案? 1.赞成;2.反对 对分类数据的描述和分析通常使用列联表 列联分析是根据样本数据来推断总体中两个分类变量相互关系的一种统计方法。可使用???检验 列联分析例题 列联分析例题 【例】1912年4月15日,豪华巨轮泰坦尼克号与冰山相撞沉没。当时船上共有共2208人,其中男性1738人,女性470人。海难发生后,幸存者为718人,其中男性374人,女性344人,以?的显著性水平检验存活状况与性别是否有关。 (? ?0.05) 列联表(contingency table) 由两个以上的变量交叉分类的频数分布表 行变量的类别用 r 表示, ri 表示第 i 个类别 列变量的类别用 c 表示, cj 表示第 j 个类别 每种组合的观察频数用 fij 表示 表中列出了行变量和列变量的所有可能的组合,所以称为列联表 一个 r 行 c 列的列联表称为 r ? c 列联表 列联表的结构(2 ? 2 列联表) 列联表的结构 (r ? c 列联表的一般表示) 观察值的分布 边缘分布 行边缘分布 行观察值的合计数的分布 例如,赞成改革方案的共有279人,反对改革方案的141人 列边缘分布 列观察值的合计数的分布 例如,四个分公司接受调查的人数分别为100人,120人,90人,110人 条件分布与条件频数 变量 X 条件下变量 Y 的分布,或在变量 Y 条件下变量 X 的分布 每个具体的观察值称为条件频数 观察值的分布(图示) 期望频数的分布 假定行变量和列变量是独立的 一个实际频数 fij 的期望频数 eij ,是总频数的个数 n 乘以该实际频数 fij 落入第 i 行 和第j列的概率,即 期望频数的分布(例题分析) 期望频数的分布 (例题分析) 利用Pearson-?2统计量来判断某个分类变量各类别的观察频数分布与某一理论分布或期望分布是否一致的检验方法 比如,各月份的产品销售量是否符合均匀分布 不同地区的离婚率是否有显著差异 也称为一致性检验(test of homogeneity) 该检验也可用于判断各类别的观察频数分布是否符合泊松分布或正态分布等 期望频数相等 【例1】为研究消费者对不同品牌的牛奶是否有明显偏好,一家调查公司抽样调查了500个消费者对4个品牌的偏好情况,得到的结果如下表所示。检验消费者对牛奶品牌的偏好是否有显著差异(?=0.05) 拟合优度检验(期望频数相等) 第1步:提出假设 H0:观察频数与期望频数无显著 差异(无明显偏好) H1 :观察频数与期望频数有显著 差异(有明显偏好) 第2步:计算?2统计量 拟合优度检验(期望频数相等) ?2 统计量计算表 拟合优度检验(例题分析) H0:观察频数与期望频数无显著差异(无明显偏好) H1 观察频数与期望频数有显著差异(有明显偏好) ? = 0.05 df = (4-1)= 3 临界值(s): 拟合优度检验(期望频数相等) 第3步:做出决策 由于自由度=4-1=3,利用Excel的【CHIDIST】函数计算的统计量的P值(右尾概率)为6.22366E-12,由于P值接近于0。拒绝原假设,表明消费者对牛奶品牌的偏好有显著差异 拟合优度检验 (使用SPSS—期望频数相等) 第1步:先指定“频数”变量 点击【Data】→【Weight-Cases】,选择 【Weight cases

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档