- 1、本文档共41页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据的描述性分析(袁军)
本章内容概述 1 本章内容是关于:单变量截面数据的特征描述 2 为了对统计分组和简单整理后的数据的进一步认识,借助于下面的四类指标进行深入讨论: 集中趋势、离散程度、偏态与峰度 3 统计指标的作用 1 集中趋势的描述 集中趋势(central tendency)反映的是一组数据向某一中心值靠拢的倾向。 数据的集中趋势通常用平均指标来反映。 集中趋势指标(平均指标)按计算方法不同分为: 1-1算术平均数(arithmetic mean) 1 概念: 算术平均数是分析社会经济现象一般水平和典型特征的最基本指标,是统计中计算平均数最常用的方法。 2 基本公式: 注意: 公式中分子和分母在经济内容上的从属关系: 公式中分子和分母在范围上是一致的,否则不是平均数 例:劳动生产率=粮食产量/种粮农民人数; 全国平均每人拥有的粮食产量=粮食产量/全国人口数。 简单算术平均数与加权算术平均数 简单算术平均数(simple arithmetic mean) 特点:适于未分组数列;每个变量值出现的次数都是1。 加权算术平均数(weighted arithmetic mean) 特点:适于分组数列;平均数的值受权数的影响。 计算公式: 其中:原始数据分为 组,第 组变量值为 对应的次数为 权数(weight) 1 概念 我们把变量数列中的次数看作变量值的权数。 原因在于: 影响平均数大小的两个因素:变量值大小和权数。 2 形式 权数有两种形式:绝对数形式(频数)、相对数形式(频率) 同一总体资料,用权数的两种形式计算的平均数完全相同。 组距数列加权算术平均数计算举例 算术平均数的数学性质 1 算术平均数与总体单位数的乘积等于总体各单位标志值的总和。 2 各变量值与算术平均数的离差之和等于零。 3 各变量值与算术平均数的离差平方之和最小。 优点:1 容易理解,便于计算 2 灵敏度高 缺点:1 容易受极端变量值的影响 2 在开口组中,代表性变差 1-2调和平均数(harmonic mean) 概念: 由于在社会经济统计中缺乏资料,计算平均数时就需要采用间接的方式,于是产生了调和平均数。 调和平均数与算术平均数的关系 调和平均数的特点 优点: 1 灵敏度高 2 在某些情况下,代替简单平均数进行计算 缺点: 1 不容易理解 2 容易受极值影响 3 有标志值为0时,不能计算 1-3 几何平均数(geometric mean) 1 概念: 若干项变量值连乘积开其项数次方的算术根。 当各项变量值的连乘积等于总比率或总速度时,适宜使用他计算平均比率或平均速度。 2 计算: 简单几何平均数: 加权几何平均数: 3 优点: 受极端变量值影响小;适宜计算平均比率和平均速度。 缺点: 有变量值为0或负值不能计算;应用范围较窄。 1-4 中位数与分位数 1 概念 总体单位标志值按大小顺序排列,处于中间位置的那个标志值就是中位数(median)Me。 意义:总体标志值中一半比中位数小,一半比它大。 人口普查中应用年龄中位数;产品质量控制中取中位数 2 计算: 先对数据进行排序; ①未分组数据确定中位数: ②单项数列确定中位数: 先求 ;计算各组的累积次数(向上或向下累计);根据中位数的位置找到中位数。 分位数 中位数的特点: 优点:容易理解;不受极端值影响;某些不具有数学特点或不能用数字测定的现象可以用中位数求其一般水平。 缺点:灵敏度差,不宜计算 分位数概念: 四分位数(Quartiles): 把一个变量数列分为四等分,形成三个分割点Q1、Q2、Q3,这三个分割点的数值就是四分位数。Q2=Me 计算:略 十分位数(dectile) 百分位数(percentile) 1-5 众数 1 概念: 众数(mode)是总体中出现次数最多的标志值。 它能直观的说明客观现象分配中的集中趋势。 2 应用举例: 有时常用众数代替算术平均数来说明社会经济现象的一般水平 例:市场上某种商品一天的价格变动,成交量最多的那个价格 大批服装(鞋)规格不同,市场需求最多的那个规格 3 计算: ①单项数列:直接观察法—出现次数最多的 ②组距数列:(仅考虑等距数列) 先观察众数所在组;然后按照公式近似推算。 1-6 各种平均指标之间的关系 1. 三类数值平均数之间: 算
文档评论(0)