- 1、本文档共47页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 描述统计学:表格法和图形法;汇总单变量数据的表格法和图形法
分类型数据的汇总
数量型数据的汇总
汇总双量数据之间关系的数据方法;频率分布(Frequency distribution)
相对频数分布(relative frequency distribution)
百分数频率分布(percent frequency distribution)
条形图(bar chart)
饼状图(pie chart)
;频数分布是一种数据的表格汇总方法,表示在几个互不重叠组别中的每一个项目的个数(即频数)。
目的是在于能够更加直观的看出各个分类型数据出现的次数。;例子;;函数语法:countif(range,criteria)
range表示要计算其中非空单元格数目的区域
criteria表示统计条件
;相对频数是属于该组的项目个数占总数的比例。
组的相对频数=组的频率/n
相对频数分布是每一组相对频率数据的表格汇总;百分频率为该组相对频率乘以100
百分频率分布是每一组百分频率数数据的表格汇总;;;;条形统计图是用一个单位长度表示一定的数量,根据数量的多少画成长短不同的直条,然后把这些直条按一定的顺序排列起来。从条形统计图中很容易看出各种数量的多少。
在分类型数据的汇总中,通常横轴表示类别,纵轴表示频率。;饼状图;频数分布
相对频数分布和百分数频数分布
打点图
直方图
累积分布
累积曲线;频数分布是表示在几个互不重叠的组中每一组所包含的项目个数(或频数)的表格汇总。
在确定数量型数据的频数分布的组时,三个必要的步骤:
确定互不重叠组的组数
确定每组的宽度
确定组限;Audit Time;关于分组的一些准则
建议分成5-20组;数据较少,组就分的少一些;数据较多,组就分的多一些。
经验式:
但是,经验公式计算出来的组数只是一个参考数值,组距的确定还要根据研究对象的实际情况,具体问题具体分析,因地制宜地加以确定。例如,成绩的分组。
;一般性原则:
等距分组和不等距分组
等距分组:标志值在各组保持相等的组距,即各组的标志值变动都限于相同的范围。一般用于标志值变动比较均匀的场合。它可以减少使用者不恰当的诠释。
不等距分组,各组的组距不相等,适用于:第一,标志值分布很不均匀的场合;第二,标志值相等的量具有不同意义的场合。第三,标志值按一定比例发展变化的场合。
;近似组宽=(数据最大值-数据最小值)/组数
组宽和组数是成反比的。
不存在最佳的频数分布。频数分布的目的是在于揭示自然的分组和数据的变异性。;按世界银行公布的数据,2008年的必威体育精装版收入分组标准为:;下组限:该组的最小可能值
上组限:该组的最大可能值
组中值:上组限和下组限的中间值
组限存在的目的是使每一个数据值属于且只属于一组。;不重不漏
当相邻两组的上下限重叠时,恰好等于某一组上限变量值算在本组内
;;相对频数是属于一个组的观测值所占的比例。如果有n个观测值:
组的相对频数=组频数/n
组的百分数频数等于相对频数乘以100.;打点图是一种最简单的数据图形汇总方式。横轴表示观测值的值域,每个数据值的频率由位于横轴上的点表示。;直方图(Histogram);;;条形图是用条形的高度表示各类别频数的多少,其宽度(表示类别)则是固定的
直方图矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义
直方图的各矩形通常是连续排列,条形图则是分开排列
;累积频数分布表示的是小于或等于每一组上组限的??据项个数,而不是表示每一组的频数。;用曲线图表示的累积分布的图形称为累积曲线。横轴上显示数据值,纵轴上显示累积频数或累积相对频数、抑或累积百分数频数。;;;竖线左边为“茎”
竖线右边为“叶”
STEM UNIT 10
表面茎的单位是10;由于茎叶显示可以显示和直方图意义的信息,但是它有两个优点:
茎叶显示易于手工绘制
在一个组内,茎叶显示提供了实际的数值,因此茎叶显示比直方图信息量更多。
在扩展的茎叶显示中,如果茎被重复两次,第一个茎对应的叶是0-4,第二个茎对应的叶是5-9。
在茎叶显示中,叶的单位可以是100,10,1,0.1等;迄今为止,我们集中讨论了用于汇总一个变量在一个时点上的数据的表格法和图形法。
管理人员和决策者往往还需要用表格法和图形法来理解两个变量之间的关系。;交叉分组表是一种汇总两个变量数据的表格方法。
交叉分组表可以用于以下情形:
两个变量都是数量型变量
两个变量都是质量型变量
一个变量是数量型,一个变量是质量型变量;;散点图是对两个数量变量间关系的图形表述。;正相关;;;趋势线(trendline)是显示相似性近似程度的一条直线。;;第二章 结束
文档评论(0)