- 1、本文档共66页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
案例2:乙班《统计学》考试情况如下表: 60分以下 2 60-70 30 70-80 8 80-90 4 90分以上 1 案例3:丙班《统计学》考试情况如下表: 60分以下 2 60-70 5 70-80 12 80-90 25 90分以上 7 问题 1、计算甲、乙、丙三个班的平均成绩;该平均值是真实值还是近似值?如是近似值,什么情况下会是真实值? 2、计算甲、乙、丙三个班的中位数、众数; 3、如要选择从算术平均数、中位数和众数三个平均数中选择一个数来分别代表甲、乙、丙三个班的整体水平,请问你会选择哪个平均数?为什么? 4、如要分别反映甲、乙、丙三个班的考试情况,你会选择用哪些指标来衡量? 5、如要比较甲、乙、丙三个班的考试情况的优劣,你又会选择什么样的指标来衡量? 6、甲乙丙三个班的考试成绩分别服从对称分布、左 偏分布、右偏分布中的哪种分布?为什么? 先计算各组的累计次数,再按公式 确定 中位数的位置,并对照累计次数确定中位数。 由组距数列确定中位数 下限公式: 为中位数组的下限; 为总次数; 为中位数组前一组的向上累计次数; 为中位数组的次数; 为中位数组的组距。 组距式变量数列计算众数的公式: 离散程度的描述 ●反映各变量值远离其中心值的程度(离散程度),从另一个侧面说明了集中趋势测度值的代表程度. 1 离散程度的常用指标 ①异众比率 式中, 为变量值的总频数; 为众数组的频数. 异众比率越大,说明非众数组的频数占总频数的比重越大,众数的代表性越差. ②全距(极差) 极差(Range)也叫全距,是一组数据的最大值与最小值之差,即: 组距分组数据可用最高组上限-最低组下限计算. ③四分位差 四分位差(quartile deviation)也称内距或四分间距(inter-quartile range),是指第三四分位数和第一四分位数之差. 四分位差的计算公式为: 把所有数据由小到大排列并分成若干等份,处于分割点位 置的数值就是分位数. 把所有数据由小到大排列并分成四等份,处于三个分割点位置的数值就是四分位数. 分位数可以反映数据分布的相对位置(而不单单是中心位置). 常用的有四分位数、十分位数、百分位数. 四分位数(Quartile): Q1 ,Q2 ,Q3; 十分位数(Decile): D1 , D2 ,..., D9; 百分位数(Percentile): P1, P2 ,...,P99 ; 四分位数的计算 首先确定四分位数的位置,再找出对应位置的标志值即为 四分位数.设样本容量为n,则 如果各位置计算出来的结果恰好是整数,这时各位置上的 标志值即为相应的四分位数;如果四分位数的位置不是整 数,则四分位数为前后两个数的加权算术平均数.权数的大 小取决于两个整数位置与四分位数位置距离的远近,距离 越近,权数越大. 在实际应用中,计算四分位数的方法并不统一(数据量大时 这些方法差别不大),对于一组排序后的数据: ● SPSS中四分位数的位置分别为 ● Excel中四分位数的位置分别为 练习: 已知9个家庭的人均月收入数据 试求这组数据的第一和第三四分位数. 四分位差反映了中间50%数据的离散程度,数值越小说明中间数据越集中. ④平均差(Mean deviation) 平均差也称平均绝对偏差,总体所有单位的标志值与其平均数的离差绝对值的算术平均数.通常用 表示. 未分组数据计算平均差的公式为: 加权式(分组数据): 平均差虽然能较好地区别出不同组数据的分散情况或程度, 但它的缺点是绝对值不适合作进一步的数学分析. ⑤标准差和方差(Standard deviation and Variance) 方差是一组数据中各数值与其算术平均数离差平方的平均数.标准差是方差中的平方根. 注:总体方差和样本方差的符号不同,计算公式也不一样.是反映定量数据离散程度的最常用的指标. 例. 在某地区抽取的120家企业按利润额进行分组,结果如表3.1所示. 表3.1 某地区120家企业的利润额分组 计算120家企业利润额的均值和标准差. * 第 四 章 数据的描述性分析 本章内容 第一节 集中趋势的描述 第二节 离散程度的描述 第三节 分布的偏态与峰度 集中趋势 集中趋势反映的是一组数据向某一中心值靠拢的倾向,在中心附近的数据数目较多,而远离中心的较少。对集中趋势进行描述就是寻找数据一般水平的中心值或代表值。 1.数值平均数:是以统计数列的所有数据来计算的平均数.其特点是统计数列中任何一项数据的变动,都会在一定程度上影响数值平均数的计算结果. 2.位置平均数:它不是对统计数列中所有数据进行计算所得的结果,而是根据数列中处于特殊位置上的个别单位或部分单位的标
文档评论(0)