3-频数分布概略度量.ppt

  1. 1、本文档共97页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
离中趋势 * * 将全部数据从小到大排列,再将数据四等分,分为点所对应的数据称为四分位数。 思考一下如何来计算四分位数?类似中位数的公式来计算 * * 众数:总体中出现频数最多的那个标志值。反应经济现象发展的一般水平。 * * * 对于组距数列,先找到众数组,再计算众数的值。 * * 要学会根据三者之间的关系判断频数分布是对称还是左偏右偏。 三者之间还有一个数量上的关系:中位数到众数的距离等于众数到算术平均数距离的三分之二。有了这个数学关系式之后就可以根据任给的其中两个数据计算另一个数据。 * 平均指标是对总体做出概括说明,代表总体的一般水平,反映变量值的集中趋势,同时变量之间还有差异的一面,我们称之为离中趋势,平均指标不能说明这一特性。 * 两个小组工人的月平均工资均为1000元,但是这两个1000元的代表性显然不同,这两组数据的离散程度不同。还需要有其他指标来度量这种离散程度。度量平均指标代表性的指标也即度量频数分布离散程度指标的定义、计算、应用是本节的内容,描述频数分布集中趋势的指标称为平均指标。把描述总体各单位标志值之间离散程度的指标称为标志变异指标。用来说明平均指标代表性的大小和数列的离散程度。 * 首先,来介绍一个最简单的指标极差或者叫全距。 * 由于其极易受极端值的影响所以使其应用受到了限制。极差越大,变量的离中趋势越大。 * 标志变异指标反映了平均指标代表性的大小,常用的平均指标是平均数。假如有一个数列,如何来计算其平均数的代表性呢?看每个标志值与平均数的离差大小来衡量,离差越小,代表性越好,离差越大,代表性就查。很显然就是用总体中的每个变量与平均数的平均离差大小。所以引入一个指标叫平均差。~~~~·因为正负离差相互抵消,所以引入绝对值。其计算公式为 * * 用了绝对值以后就避免了正负离差相互抵消,同时绝对值在计算时比较复杂,所以要想办法取消绝对值,还不使得正负离差相互抵消。 * 方差和标准差越大,离散程度越大;衡量平均指标的代表性。 * * * 标准差是反映标志变动度的绝对指标,它的大小不仅取决于标志值的离散程度,还取决于数列平均水平的大小。因而对于具有不同平均水平的数列,不能直接通过标准差来比较标志变动度的大小,而需要将标准差与相应的平均数对比,来计算标准差系数。 * * * 四分位差越大,中位数代表性越差。 * * 异众比率:分布数列中非众数组的频数与总频数的比率。用于衡量众数对一组数据的代表性大小。异众比率越大,说明非众数组的频数占总频数的比重越大,众数的代表性越差;反之,众数的代表性好。 * 平均指标和标志变异指标分别描述了变量数列分布的集中趋势和离中趋势,但要全面了解数据分布的特点,还要知道其分布曲线是否对称,偏斜的程度以及分布曲线的尖峭程度。偏度和峰度就是对变量数列分布的形状特征进行描述。 * 偏度反映了分布的偏斜方向以及偏斜的程度,常用偏度系数来度量。它的计算方法有很多,我们介绍其中一种。对称分布时=0,大于0为右偏或正偏;小于0为左偏或负偏。其绝对值越大,则偏斜的程度越大。 * 峰度反映了分布曲线的尖峭程度,一般用峰度系数来度量,峰度系数大于3称为尖峰分布,说明分布曲线比较陡峭。小于3称为平峰分布,说明其分布曲线较平坦。 * 男女性别比例 平均指标反映了数据分布的集中趋势。对于一分布数列,我们不仅要研究其集中趋势,还要考察各标志值离开平均数的程度有多大(离中趋势)。换句话说,就是要看平均数的代表性高低。数据的离中趋势越大,标志变异指标的值越大,平均数的代表性也就越低。反之,数据的离中趋势越小,标志变异指标的值越小,平均数的代表性越高。 举例 某工厂生产一批零件共10万件,为了解这批产品的质量,抽取1000件进行检查,结果如下: 使用寿命(小时) 零件数(件) 700以下 700-800 800-900 900-1000 1000-1100 1100以上 10 60 230 450 190 60 根据质量标准,使用寿命800小时及以上者为合格品。计算平均合格品率、标准差及标准差系数。 合格品率 标准差 标准差系数 答案 本章作业 6、9、11、12 * 根据统计调查得到的数据资料编制频数分布表或绘制频数分布图,能够粗略的反应总体频数分布的趋势和特征。 * * 但是要对频数分布数列的特征进行更精确地度量,则需用一些统计指标,从不同的侧面反映数据的特征。对频数分布的特征,可以从其分布的中心位置、离散性、偏度和峰度来加以描述。这就是我们第三章所要学习的内容 * 用什么指标来衡量频数分布的数据特征。 * 在这一章,我们从三个方面来对频数分布的特征进行描述,分别是:中心位置、分散程度和形状。对频数分布的中心位置的描述反映了频数分布的集中趋势,图中~~~~~~~· 第二,是从离散程度方面对频数

文档评论(0)

kehan123 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档