统计数据的描述性分析.docVIP

统计数据的描述性分析.doc

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共7页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计数据的描述性分析

第5章 统计数据的描述性分析 常用来度量集中趋势的指标包括:平均数、中位数、众数。 平均数是说明社会经济现象、传播现象等一般水平的统计指标,反映标志值分布的集中趋势。 学习目标 了解集中趋势的量数 计算一组数据的均值  计算一组数据的众数和中位数 选择一种集中趋势度量数 一. 平均数 ——是根据总体各单位所有标志值计算出的平均数。 (一). 算术平均数 平均数的基本公式 (1)简单算术平均数 简单算术平均数主要用于未分组资料,用总体各单位标志值简单加总得到的标志总量除以单位总量而得。计算公式: 我国电视观众调查 加权算术平均数主要用于原始资料已经分组,并得出次数分布的条件。计算公式: 例:2006年1月比特啤酒公司销售点销售量 60个销售点的啤酒销售量 (单位:桶) 比特啤酒公司每个销售点月销售量? 权数:各组次数(频数)的大小所对应的标志值对平均数的影响具有权衡轻重的作用。 当各组的次数都相同时,即当f1=f2=f3=…=fn时: 加权算术平均数就等于简单算术平均数。 使用 SPSS求算术平均数 利用Analyze==Descriptive Statistics==Descriptives菜单算术平均数 二.中位数(Median) 将总体各单位标志值按由小到大的顺序排列后处于中间位置的标志值称为中位数,记为Me。 中位数是描述分布中心趋势的另一种典型的度量。中位数是“最中间的数”,一半的观测值比它小,一半比它大。 中位数是是根据总体标志值所处的特殊位置确定的一类平均指标-位置平均数,不受极端数据的影响。当统计资料中含有异常的或极端的数据时,中位数比算术平均数更具有代表性。 一种比如有 5 笔付款:9元,10元,10元,11元,60元 付款的均值为 20 元,显然这并不是一个很好的代表值,而中位数 M = 10 元则更能代表平均每笔的付款数。 观测变量为定序变量、定距变量或定比率变量时,中位数都是有意义的;但是不适于定类变量。 寻找中位数的步骤 ·将所有n个观测值按由小到大的顺序排列; ·如果观测值的个数为奇数 ·如果观测值的个数为偶数,中位数就是排序后最中间的两个观测值的平均。 三、众数( Mode) ——是总体中出现次数最多的标志值,记为M 0。 众数明确反映了数据分布的集中趋势,也是一种位置平均数,不受极端数据的影响。但并非所有数据集合都有众数,也可能存在多个众数。 在某些情况下,众数是一个较好的代表值。 例如在服装行业中,生产商、批发商和零售商在进行生产和存货决策时,更感兴趣的是最普遍的尺寸而不是平均尺寸。 又如,当要了解大多数家庭的收入状况时,也要用到众数。 平均数、中位数、众数间的关系 1.频数分布呈完全对称的单峰分布,算术平均数、中位数和众数三者相同。 在偏斜分布中,中位数和平均数可能相差很远。 例如有关收入、广告投入等的分布,出于有少数人的收入非常高,或有个别几家企业投入了天文数字的广告费用,致使分布的右边尾巴很长。这个长尾巴会将平均数拉高,这时再采用平均数来描述分布的中心就没有什么实际意义 不管这些巨额广告投入有多大,对中位数的值不会有什么影响,因为它们只不过是“中间点”右边的个别点而已。 因此,对于分布中有少数极端值存在、或分布严重偏斜致使一边拖着很长尾巴的情况下,最好采用中位数而不是平均数来描述分布的中心,以免造成误会。 当分布比较有规律时,采用平均数则优于中位数 当次数分配呈右偏(正偏)时:算术平均数受极大值的影响 当次数分配呈左偏(负偏)时,算术平均数受极小值的影响 中位数则总是介于众数和平均数之间。 均值和中位数的关系 均值是一系列数值的中间点。 中位数是一系列个体的中间点 中位数关注的是有多少个个体,而不是有多少个数值,极值(奇异值)就不会对中位数产生影响。 练习: 1.假定你是快餐厅的经理,向老板汇报每天的特惠食品的经营情况,写一个简短的报告: 特惠食品    售出数量 价格(美元) Huge Burger 20     2.95 Baby Burger 18    1.49 Chicken Littles 25    3.50 Porker Burger 19    2.95 Yummy Burger 17    1.99 Con Dog 20    1.99 售出总数    119

文档评论(0)

panguoxiang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档