- 1、本文档共46页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[理学]第2章 统计数据的描述
均值的作用及特点(P34) 集中趋势的最常用测度值 一组数据的均衡点所在 体现了数据的必然性特征 易受极端值的影响 用于数值型数据,不能用于分类数据和顺序数据 用于对绝对数数列的平均,不适用于对比率数列和平均数数列的平均 简单均值(P32) 对于未分组数据: x1 ,x2 ,… ,xn 总体均值 样本均值 说明:两公式结构相同,只是数据来源不同而已。 求简单均值的例题(P22) 例:某车间工人加工零件数量(见课本P22表2.7) 经统计得30名工人周加工零件总数为3105件,求平均加工零件数。 解:平均加工零件数为。 次数加权均值(P33) 设分组数据为: x1 ,x2 ,… ,xk , … 相应的频数为: f1 , f2 ,… ,fk , … 说明:两公式结构相同,只是数据来源不同而已。 总体均值 样本均值 求次数加权均值的例题(P22)(单变量值分组) P22表2.6 某班学生按年龄分组统计表如下 求该班学生的平均年龄。 按年龄分组(岁) 人数 17 6 18 14 19 18 20 9 21 3 合计 50 2.4.1 统计数据的分组(P21) 按数据的四种计量尺度,采用不同的分组方法: 1.列名尺度和顺序尺度是按照事物的性质和属性划分的,按该两种尺度分组又称为按品质标志分组。 2.间隔尺度和比例尺度是按照事物的数量标准划分的,按该两种尺度分组又称为按数量标志分组。 1.按品质标志分组的方法 基本方法:按各不同性质、属性划分类别 而分组。 [例1] 将学生按性别(列名尺度)分为“男”、“女”两组。 [例2] 将学生按等级成绩 (顺序尺度)分为“优”、“良”、“中”、“及格”、“不及格”五组。并在分组表中,按顺序排列各组名称。 2.按数量标志分组的方法 基本方法:按数量标志的不同属性(连续变量、离散变量)进行不同类型(单变量值分组、组距分组)的分组。具体有四种不同方式: 1》离散变量——变量只间断取值 (1)取值范围小:以各变量值为组名称~单变量值分组(常用) (2)取值范围大:以两整数值代表两整数间距~组距分组 2》连续变量——变量可连续取任意数值 (3)以一整数值代表相邻两整数间距~单变量值分组 (4)以两整数值代表两整数间距~组距分组(常用) (1)单变量值分组的条件及方法 变量取值范围小时都可应用单变量值分组,但连续变量与离散变量的分组定义不相同。 1.在变量只取整数且取值范围较小时,可采用单变量值分组,即每一个变量值作为一组。这时,各单变量值作为组的名称,也是组的取值范围。 2.在变量连续取值且常用整数代表两相邻整数间区间时,若取值范围较小,亦可采用单变量值分组。这时,各单变量值作为组的名称,两相邻整数间区间才是组的取值范围。 单变量值分组的例 当变量取值范围较小时,常采取单变量分组 1. 家庭人口数是离散变量,其取值范围小 中国家庭按人口数分组,可分为1人、2人、3人、…、8人等八个组。 2.幼儿园小朋友年龄是连续变量,其取值范围小 幼儿园小朋友按年龄分为3岁、4岁、5岁、6岁四个组(k岁组包含足k岁至k+1岁以下) 。 (2)组距分组的条件及方法 对取值范围大的离散变量及连续变量都可应用组距分组 将变量值的一个区间作为一个组 更适合于连续变量 适合于变量值较多的情况 注意遵循“不重不漏”的原则 可采用等距分组,也可采用不等距分组 可采用闭口分组,也可采用开口分组 常采用重叠组限方式分组,这时常规定“上限不在组内”的原则 也可以采用不重叠组限方式分组,这时常规定“实际上限为上组的下限”(上组即为较大组-可由垂直向上的数轴确定方向) 10 ~ 20 20 ~ 30 30 ~ 40 40 ~ 50 50 ~ 60 组距分组的例 当离散变量取值范围较大时,常采用组距分组 1.企业职工人数是离散变量,其取值范围大 企业按职工人数可分为1~9人、 10~99人、 100~999人、1000~9999人、10000~99999人、 100000~999999人、1000000~999999人等七组。(不等距、闭口、不重叠组限) 对连续变量必须采用组距分组 2.百分制成绩是连续变量,其取值范围大 将百分制考试成绩分为60以下、60~70、70~80、80~90、90以上等五组。(等距、开口、重叠组限) 作组距分组的一般步骤及方法 确定组数:组数的确定,应以能够显示数据的分布特征和规律为目的 ⑴斯特格斯经验公式:
文档评论(0)