数据的收集与整理优秀课件PPT.ppt

  1. 1、本文档共70页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据的收集与整理优秀课件PPT

组数与组距 组数:数列分组的数目。组数的确定应以能够显示数据的分布特征和规律为原则。 组距:在组距数列中,用变量值的一定区间(范围)代表一个组,每个区间的宽度称为组距。 对同一总体而言,组距越大,组数越少; 组距越小,组数越多。 组数=全距/组距 组距=全距/组数 组数的多少与组距大小有关。 如何确定组数与组距? 异距数列中,组距的确定主要根据所研究事物的分布特征。 等距数列中,组距与组数的确定都可利用Sturges经验公式。 A、若先求组距,再求组数 B、若先求组数,再求组距 斯特奇斯经验公式: 其中:N为数列总次数(变量值个数) 组限 : 组距的两个端点。有上限(upper limit) 和下限(lower limit)之分。 开口组: 闭口组: 有上限缺下限;或有下限缺上限。往往出现在最低组(首组)或最高组(末组)。 上限、下限都齐全。 如何确定组限? 最低组的下限应小于或至多等于原始资料中的最小值;最高组的上限应大于或至少等于原始资料中的最大值。 连续变量相邻两组的组限必须重叠。离散变量相邻两组的组限一般间断。 “上限不在内”原则。即恰好重叠在组限上的变量值一般归入下限的一组,避免频数的重复计算。 穷尽 互斥 开口组的组中值计算: 组中值 : 每组上限与下限之间中点位置上的数值。 只有上限,无下限: 只有下限,无上限: 按每户月平均收入分组(元) 户数(户) 比重(%) 1000以下 1000~2000 2000~3000 3000~4000 4000~5000 5000以上 20 49 95 50 40 26 7.1 17.5 33.9 17.9 14.3 9.3 合计 280 100 累计次数与累计频率 较小制累计:从变量值小的组向变量值大的组累计。 较大制累计:从变量值大的组向变量值小的组累计。 按销售额分组 (万元) 商店数 较小制 累计 较大制 累计 100以下 100~200 200~300 300~400 400以上 2 4 8 5 1 2 2+4=6 6+8=14 14+5=19 19+1=20 18+2=20 14+4=18 6+8=14 1+5=6 1 合计 20 — — 按结婚年龄分组(岁) 人数(人) 频数密度(人/岁) … … … 26~27 30 30 … … … 40~50 35 3.5 按成绩分组(分) 人数(人) 比重(%) 60~70 70~80 80~90 12 18 10 30 45 25 合计 40 100 表1: 表2: 次数分布数列的编制程序 1、将原始资料按大小顺序排列,确定总体中的最小值、最大值以及全距; 2、确定编制数列的类型; 3、确定组数和组距 ; 4、确定组限; 5、计算各组次数或频率,编制分布数列表。 * 滚雪球抽样 snowball sampling 以若干个具有所需特征的人为最初的调查对象,然后依靠他们提供认识的合格的调查对象,进行后续的调查。依此类推,形成滚雪球效应。 滚雪球抽样多用于总体单位的信息不足或观察性研究的情况。适合于对稀少群体和特定群体的研究。 优点:容易找到那些属于特定群体的被调查者,调查的成本也比较低。 这种抽样中有些分子最后仍无法找到,有些分子被提供者漏而不提,两者都可能造成误差。 配额抽样 quota sampling 也称定额抽样,是将总体依某种标准分为若干类(层、群),然后在每个类中采用方便抽样或判断抽样的方式选取样本单位。 定额抽样与分层概率抽样很接近,最大的不同是分层概率抽样的各层样本是随机抽取的,而定额抽样的各层样本是非随机的,是按事先规定的条件有目的地寻找的。所以属于非概率抽样。 操作简单,可以保证总体中不同类别的单位都能包括在所被抽的样本之中,使得样本结构和总体结构类似。 这项抽样方法要求对总体的情况比较了解。 在佛州的选票最后决出之前,全美国9000多万张普选选票中,民主党候选人阿尔.戈尔获得50,140,140张选票,占49%,乔治.布什获得49,782,288张,占48%。戈尔领先布什357,932张选票;在全美国538张选举人票中,戈尔获得267张;布什获得246张。 此后,小布什在佛罗里达州600多万张普选选票中以仅多出戈尔537张的优势获得该州的25张选举人票,当选美国总统。 2000年美国大选 2000年,乔治·布什成为继1888年本杰明·哈里森之后第一位以少数选民票当选的总统。戈尔在全国大选中领先布什35万多票,但最终结果却要由佛罗里达艰苦漫长的人工点票决定。大选结束四周以后最高法院以5:4决定停止佛州人工点票,将该州25张总统选举人票判给布什。20

文档评论(0)

jiaoyuguanliji + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档