网站大量收购独家精品文档,联系QQ:2885784924

用样本的频率分布估计总体分布要点.ppt

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
用样本的数字特征估计总体的实在特征 1.平均数、中位数和众数 (1)平均数:一组数据的总和除以数据的个数所得到的商就是平均数 (2)中位数:如果将一组数据按从小到达的顺序依次排律,当数据有奇数个时,处在最中间的一个数;当数据有偶数个时,处在最中间两个数的平均数,是这组数据的中位数。 (3)众数:出现次数最多(若有两个或几个数据出现得最多,且出现的次数一样,这些数据都是这组数据的众数;若每个数据出现的次数一样多,则认为这组数据没有众数。) (4)在频率分布直方图中也可以找到众数、中位数。 1.众数体现了样本数据的最大集中点,但它显然对其它数据信息的忽视使得无方各观地反映总体特征。 2.中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。 3.由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数不具备的性质。也征引为如此与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息。 练习:1、应该采用平均数来表示每一个国家项目的平均金额,因为它能反映所有项目的信息。但平均数会受到极端数据2200万元的影响,所以大多数项目投资金额都和平均数相差比较大。 1.标准差、方差的定义与求法 2.概念的理解: (1)标准差、方差描述了一组数据围绕平均数波动的大小。标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小,就越稳定。 (2)因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上一样的,但在解决实际问题时,一般多采用标准差。 思考6:从居民月均用水量样本数据可知,该样本的众数是2.3,中位数是2.0,平均数是1.973,这与我们从样本频率分布直方图得出的结论有偏差,你能解释一下原因吗? 频率分布直方图损失了一些样本数据,得到的是一个估计值,且所得估计值与数据分组有关. 注:在只有样本频率分布直方图的情况下,我们可以按上述方法估计众数、中位数和平均数,并由此估计总体特征. 如何根据样本频率分布直方图,分别估计总体的众数、中位数和平均数? (1)众数:最高矩形下端中点的横坐标. (2)中位数:直方图面积平分线与横轴交点的横坐标. (3)平均数:每个小矩形的面积与小矩形底边中点的横坐标的乘积之和. 总结 三 三种数字特征的优缺点 1、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征. 如上例中众数是2.25t,它告诉我们,月均用水量为2.25t的居民数比月均用水量为其它数值的居民数多,但它并没有告诉我们多多少. 2、中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。 如上例中假设有某一用户月均用水量为10t,那么它所占频率为0.01,几乎不影响中位数,但显然这一极端值是不能忽视的。 3、由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质。 也正因如此 ,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。 90 100 110 120 130 140 分数 频率 0.45 0.05 0.15 1、某市高三数学抽样考试中,对90分以上(含90分)的成绩进行统计,其频率分布图如图,若130~140分数段的人数为90人;则90~100分数段的人数为: ; 810 (2003,安徽) 四 众数、中位数、平均数的简单应用 2、一个容量为20的样本数据.分组后.组距与频数如下:(0,20] 2;(20,30] 3, (30,40] 4; (40,50] 5; (50,60] 4; (60,70] 2。则样本在(-∞,50]上的频率为: , 7/10 (2002,江西) 2400 2700 3000 3300 3600 3900 X 体重 y 0.001 3、观察新生婴儿的体重,其频率分布直方图 如图所示,则新生婴儿体重(2700,3000)的频 率为: ; 0.3 五、1、阅读课本73页的思考,举例分析中位数对极端值不敏感的利与弊。 2、 六、作业 2、 某工厂人员及工资构成如下: 6900 100 2000 1100 1500 2200 合计 23 1 10 5 6 1 人数 100 200 220 250

文档评论(0)

w5544434 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档