十交叉表分析法(课件).docVIP

十交叉表分析法(课件).doc

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
十交叉表分析法(课件)

多变量描述统计分析 交叉表分析法 一、交叉表分析法的概念 交叉表(交叉列联表) 分析法是一种以表格的形式同时描述两个或多个变量的联合分布及其结果的统计分析方法,此表格反映了这些只有有限分类或取值的离散变量的联合分布。当交叉表只涉及两个定类变量时,交叉表又叫做相依表。 交叉列联表分析易于理解,便于解释,操作简单却可以解释比较复杂的现象,因而在市场调查中应用非常广泛。 频数分布一次描述一个变量,交叉表可同时描述两个或更多变量。交叉表法的起点是单变量数据,然后依研究目的将这些数据分成两个或多个细目。 下面是一个描述交叉表法应用的例子。 某保险公司对影响保户开车事故率的因素进行调研,并对各种因素进行了交叉表分析。 表1 驾驶员的事故率 类 别 比率,% 无事故 61 至少有一次事故 39 样本总数,人 17800 从初始表1中可以看出,有61%的保险户在开车过程中从未出现过事故。 然后,在性别基础上分解这个信息,判断是否在男女驾车者之间有差别。这样就出现了二维交叉表2。 表2 男女驾驶员的事故率 类 别 男,% 女,% 无事故 56 66 至少有一次事故 44 34 样本总数,人 9320 8480 这个表的结果令男士懊恼,因为他们的事故率较女士驾车时涉及的事故率要高。但人们会提出这样的疑问而否定上述判断的正确性,即男士的事故多,是因为他们驾驶的路程较长。这样就引出第三个因素驾驶距离,于是出现了三维交叉表3。 表3 不同驾驶距离下的事故率 类 别 男,% 女,% 驾驶距离 1万公里 1万公里 1万公里 1万公里 无事故 51 73 50 73 至少有一次事故 49 27 50 27 样本总数,人 7170 2150 2430 6050 结果表明,男士驾驶者的高事故率是由于他们的驾驶距离较女士长,但并没有证明男士和女士哪个驾驶得更好或更谨慎,仅证明了驾车事故率只与驾驶距离成正比,而与驾驶者的性别无关。 二、两变量交叉列联表分析 例如,研究城镇居民在某地的居住时间与其对当地百货商场的熟悉程度之间的关系,对“居住时间”和“熟悉程度”这两个变量进行交叉列联分析。如表4所示。 表4 居住时间与对百货商场的熟悉程度的交叉列联分析(频数) 熟悉程度 居住时间 合计 13年以下 13年~30年 30年以上 不熟悉 熟悉 45 52 34 53 55 27 134 132 合计 97 87 82 266 那么,到底居住时间与对商场的熟悉程度有没有关系呢?由表4可见,居住时间低于30年的居民比居住时间在30年以上的居民似乎更熟悉百货商场。进一步计算出百分比,则可以看得更直观一些。见表5。 表5 居住时间与对百货商场的熟悉程度的交叉列联分析(%) 熟悉程度 居住时间 13年以下 13年~30年 30年以上 不熟悉 熟悉 46.4 53.6 39.1 60.9 67.1 32.9 合计 100.0 100.0 100.0 行百分比与列百分比的选择取决于哪个变量是因变量哪个变量是自变量。一般的规则是,在自变量的方向上,对因变量计算百分比。 以表5为例,居住时间为自变量,对商场的熟悉程度为因变量,因而可以对各居住时间分别计算熟悉程度的百分比。由表5可见,53.6%的居住时间低于13年的人和60.9%的居住时间在13年~30年的人都熟悉该商店,而只有32.9%的居住时间在30年以上的人熟悉该商店。看来,同样住在该地区的人,居住时间越长,对购物环境反而更不熟悉。这个结论是有一定道理的,在一个地方居住很长时间的人一般相对来说更没有动力去熟悉该商场。 如果我们在因变量的方向上对自变量计算百分比(如表6所示),则显然没意义。 表6 居住时间与对百货商场的熟悉程度的交叉列联分析(%) 熟悉程度 居住时间 行合计 13年以下 13年~30年 30年以上 不熟悉 熟悉 33.6 39.4 25.4 40.1 41.0 20.5 100.0 100.0 表6暗示,对当地商场不熟悉会影响居民在该地的居住时间,这显然是不合理的。但是,居住时间与对百货商场的熟悉程度之间的联系可能受第三变量的影响,例如年龄。居住时间越长的人可能年龄越大。尽管分析结果表明年龄在此不是影响因素,但由此可见需要检查第三因素的影响。 三、三变量的交叉列联表分析 引入第三变量后再进行交叉列联分析,则可能出现以下四种结果: (1)剔除外部环境的影响,使原先两变量间的关系更单纯。例如,在表7中,仅分析婚姻状况和衣服支出水平这两个变量时,从数字上看未婚者在衣服支出方面比已婚者更高一些。但引入变量性别以后,发现对于男性

文档评论(0)

panguoxiang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档