[理学]统计学Chapter 2.ppt

  1. 1、本文档共39页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[理学]统计学Chapter 2

2.4 列联表 表2.10 以国家的两个取值(中国和美国)的条件的对新凉鞋态度的条件分布 态度 合计 完全赞成 有些赞成 既不反对也不赞成 有些不赞成 完全不赞成 不知道 中国 计数 国家 中的 % 52 58 25 12 3 1 151 34.4% 38.4% 16.6% 7.9% 2.0% .7% 100.0% 美国 计数 国家 中的 % 31 48 45 19 10 3 155 19.9% 30.8% 28.8% 12.2% 6.4% 1.9% 100.0% 2.4 列联表 分别看表2.10的每一行,我们可以在选中国家的前提下得到对新凉鞋态度的条件分布。每一行的百分数之和都为100%,根据被调查者的回答分配百分数。 实际上,我们可以把被调查者限制为在中国的顾客,这样可以了解他们的态度是如何分布的,这样的分布称为条件分布(conditional distribution),因为它表示了那些调查在满足一个条件的前提下得到的感兴趣的一个变量的分布。 2.4 列联表 我们可以使用饼图比较两个条件分布,见图2.13。从图中可以看出,中国新款式赞成的比例高于美国。 图2.13 中国和美国分别关于新凉鞋款式的态度调查的饼图 2.4 列联表 要了解每一行的百分数的变化,还可以通过条形图进行观察,这也是展示条件分布的一种方式。 图2.14 中国和美国分别关于新凉鞋款式的态度调查的并排的条形图 2.4 列联表 在列联表里还有一种情况是,如果一个变量的分布对于另一个变量的所有取值保持不变,则我们可以说这个两个变量是独立的(independent),这表明这些变量之间没有关联。 2.4 列联表 列联表中的一个经典例子就是著名的泰坦尼克号邮轮的海难数据。该数据有4个定性变量:(1) 仓位等级(Class):分一等舱(1st)、二等舱(2nd)、三等舱(3rd)、船员(Crew)四个水平;(2) 性别(Sex):有男(Male)、女(Female) 两个水平;(3) 年龄:有儿童(Child)、成年人(Adult)两个水平;(4) 是否生还(Survived):分否(No)、是(Yes)两个水平。 2.4 列联表 该数据最简单的表格是两维的表格。下面是基于性别与否生还两个变量得到的2×2表格。 从表中可以看出男性生还的人数比女性多23个,但男性死亡的比女性多1138个。 是否生还 否 是 性别 男性 1364 367 女性 126 344 2.4 列联表 如果把四个变量都选入,就得到4×2×2×2表。显然这样的表格看起来就罗唆多了。 仓位登记 一等舱 二等舱 三等舱 四等舱 性别 年龄 是否生还 否 是 否 是 否 是 否 是 男性 儿童 0 5 0 11 35 13 0 0 成年人 118 57 154 14 387 75 670 192 女性 儿童 0 1 0 12 17 14 0 0 成年人 4 140 13 80 89 76 3 20 企业风险管理 * 统计学:思想、方法与应用 袁卫 刘超 欢迎交流 新浪微博/qingyuanliu 第2章分类数据的描述方法 2.1 数据分析的三个原则 2.2 频数表 2.3 统计图 2.4 列联表 学习目标 用频数表描述数据的分布; 用条形图、饼图、百分条图等图形来展示数据; 用列联表分析两个分类指标之间的关系; 相关理论在统计软件中的应用; 相应统计分析结果的解读。 在收集好数据之后,我们必须在数据中寻找所包含的信息。 虽然我们在电子表格或其他数据文件中可以直接看到数据,但是数据如此之多,以至于我们无法把他们全部理解。 因此,我们必须使用一些方法从数据中提取信息,并转化成可用的形式。 数据分析包括三种形式:为数据画一个图,制作一个表或者计算一些我们感兴趣的东西。 这可以帮助我们对数据进行简化。简化使得理解数据和从数据中提取信息变得容易了。 但是数据简化有一个不足之处,就是难以从简化的形式中恢复原始数据,因此,当我们分析数据时,几乎总会丢失某些信息。 2.1数据分析的三个原则 一幅好图胜千言。 数据分析有三个原则: 1、绘制一个图。图像可以帮助你看到从数据表里看不到的信息,有助于你选择分析的方法,帮你明确思考隐藏在数据背后的模式和关系。 2、绘制一个图。精心设计的图像在分析工作中很重要。它能够展现重要的特征和模式,有时候可以揭示出你意想不到的事情:值得注意的(可能是错误的)数据或意想不到的模式。 3、绘制一个图。使用一个精心挑选的图像是向其他人汇报你的数据分析结果的最佳方式。 2.2频数表 频数表(frequency table)或频数分布表(frequency distribution table)可以帮助了解变量取值的分布状

文档评论(0)

skvdnd51 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档