管理统计学:第三章:样本数据特征.ppt

  1. 1、本文档共55页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
管理统计学:第三章:样本数据特征

众数定义2:对刻度级的数据,在等区间分组的直方图中,最高的矩形(即峰Peak)所表示的数据区间,称为该数据集合的众数区间,简称众数。如: 众数区间,也有单一众数和复众数之分。 问:众数适用于什么测度?广义与侠义 3.3.2 样本中位数(Sample median) 样本中位数: 设,样本数据集合中的所有数据的排序结果为X1≤X2≤……≤Xn,n为样本容量。样本中位数,就是上述序列中,处于“正中间位置”上的数据。 两个要素:位与数。 正中间位置“号码”=(n+1)×0.5 例1:17.0 17.1 17.2 17.5 17.5 17.6 17.6 Me=17.5 例2:16.8 17.0 17.1 17.2 17.5 17.5 17.6 17.6 Me=17.35 问:中位数适用于什么测度? 分奇偶个数。 3.3.3 样本均值(Sample Mean) 样本均值(Sample Mean) 样本均值仅适用于刻度级的数据。 样本数据集合的样本均值定义为: 式中,Xi为样本观察值。 第3.4节 样本数据的离散特征 描述数据集合的离散特征的两种方法: 一、点状描述,如明确样本数据集合中的最小值和最大值等; 二、区间描述(基于差值的描述),如样本数据集合中的最大值与最小值之差。 3.4.1 对样本数据离散特征的点状描述:极值、四分点与百分位点 1.极大值(Maximum)与极小值(Minimum) 极大值与极小值,从一定视角反映了样本数据集合中样本的离散情况。 问:极大值、极小值适用于什么测度? 另一个位与数的问题: 2.下四分点(Lower quartile)与上四分点(Upper quartile) 1)上、下四分点的概念 下四分点使由小到大排序后的数据集合的左边部分,包含25%的样本总个数,右边部分包含75%的样本总个数。 上四分点使由小到大排序后的数据集合的左边部分,包含75%的样本总个数,右边部分包含25%的样本总个数。 上、下四分点在一定意义上反映了样本数据的离散情况。 2)上、下四分点(及中位数)的位置 Q1:下四分点,Q3:上四分点,Q2=Me:中位数,n:该数据集合的数据总个数。 下四分点Q1的位置=(n+1)×0.25 正中间Q2的位置=(n+1)×0.5 上四分点Q3的位置=(n+1)×0.75 3)上、下四分点(及中位数)的值 当Q1、Q2、Q3的位置为整数时,相应整数位置上的样本值,就是当Q1、Q2、Q3的值。 当其不为整数时: Q1=Q2位置左边的样本值+(Q1位置右边的样本值-Q1位置左边的样本值)×Q1位置的小数部分 Q3=Q3位置左边的样本值+(Q3位置右边的样本值-Q3位置左边的样本值)×Q3位置的小数部分 本页公式,可以不讲 3)上、下四分点(及中位数)的值 公式表达之二: Q1=Q1位置左边的样本值+(Q1位置右边的样本值-Q1位置左边的样本值)×{(n+1)×0.25-[(n+1)×0.25]} Q3=Q3位置左边的样本值+(Q3位置右边的样本值-Q3位置左边的样本值)×{(n+1)×0.75-[(n+1)×0.75]} 式中,[]是取整函数,例如,[5.75]=5 4)例题 例3.4.1数据:99.8,99.9,100.1,100.2,求Q1、Q2、Q3的值。 下四分点Q1的位置=(4+1)×0.25=1.25,该位置左边有1个数据(占总数的25%)。 中位数Q2的位置=(4+1)×0.5=2.5,该位置左边有2个数据(占总数的50%)。 上四分点Q3的位置=(4+1)×0.75=3.75,该位置左边有3个数据(占总数的75%)。 以下是Q1、Q2、Q3的位置的图形表示: 计算Q1、Q2、Q3的值: Q1=99.8+(99.9-99.8)×0.25=99.825 Q2=Me=99.9+(100.1-99.9)×0.5=100.0 Q3=100.1+(100.2-100.1)×0.75 =100.175 当Q1、Q3的位置不是整数时(也就是n+1不能被4整除时),Q1、Q3的值是通过四则运算得到的,所以用Q1、Q3表示离散状况,仅适用于刻度级的数据。 当Q1、Q3的位置是整数时(即n+1能被4整除时),Q1、Q3的值就是相应位置上的值,所以用Q1、Q3表示离散状况,适用于顺序级以上的数据。 有关上四分点、下四分点和中位数的手工计算,不是很重要的。 很重要的是上四分点、下四分点和中位数的概念。 计算将由SPSS软件完成。 百分位点的概念,很容易从四分位点推广得到。 3.4.2 对样本数据离散特征的区间描述:极差、四分距与离差 “区间描述”,必然要做加减运算,因此,区间描述仅适用于刻度级的

文档评论(0)

wdhao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档