章描述性统计.ppt

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
章描述性统计

Excel 统计分析 * 第3章 描述性统计 本章内容 3.1 中心趋势 3.2 离中趋势 3.3 偏度 3.4 峰度 3.5 利用分析工具进行描述性统计 3.1 中心趋势 中心趋势又称为定位度量或者平均数,是一组数据典型的或有代表性的值,由于这样的典型值趋向于落在根据数值大小排列,得数据的中心,因此被称为中心趋势度量。 中心趋势的类型包括:算数平均值、几何平均值、众数、中位数和调和平均数。 算数平均值 非组数据的算数平均值:将所有单个观测值相加再除以观测值总数目求得。N个数X1,X2,…,XN,的算数平均值为 对于组数据,等级区间的上下限经常未定,因此对于上下限未定的组数据,通常首先要根据数据的特性假定限值,然后求解算数平均值。 其中, 为每个等级区间的中点,f为每个等级区间的频率,m为等级区间的数目,n为数据观测值的总数目。 几何平均值 几何平均值是度量平均值的一种方法,尤其是在计算平均增长率、平均收益率时被经常使用。 例:某人在第一年初即将10000元进行投资,结果由于投资失利,第一年末亏损了5000元,则对应的第一年的收益率为(50-100)/100=-50%,但投资者并未灰心,在第二年初拿着剩余的5000元再次投资,大赚5000元,第二年的收益率为(100-50)/50=100%,那么此投资者两年的平均收益率是多少? 度量m年的增长率的几何平均值应为: 其中, 是 , 是第i年的增长率。 众数 众数是所有研究变量中出现频率最高的数值,即以最大频率出现的数。 非组数据的众数计算较为简单,组数据的众数一般可以根据组数据的频率分布或者直方图来计算,对应公式为: 其中, 为包含众数的组的下组界, 为众数所在组的频数减去前一组的频数, 为众数所在组的频数减去后一组的频数,c为众数所在组的组距宽度。 中位数 中位数是根据按顺序排列形成的序列中中间位置的观测值,或两个中间值的算数平均值。根据数据类型可以分为非组数据的中位数、足离散数据的中位数和组连续数据的中位数。 组数据无法获知每个观测值的数值,只能假设数据在每个等级区间均匀分布来估计。 组离散数据的中位数,首先要构造累积频率分布表,然后通过累积频率分布表确定数据的中位数对应的观测值的位置,然后根据观测值的位置按照插值法估算数据的中位数。 组连续数据的中位数,在假设数据在每个等级区间内均匀分布下,可采用以下公式来估计组数据的中位数: 其中,L为中位数的组的下限,i为中位数所在组的宽度,F 为至中位数组前一组的累积频率,f为中位数所在组的频率,n为观测值总数目。 调和平均数 N个数X1,X2,…,XN,的调和平均数H等于这些数的倒数的算数平均数的倒数。 3.2 离中趋势 离中趋势度量数据围绕中心点是如何分散的。较常用的方法有:方差、标准差、四分位数偏差和方差系数。 方差 非组数据的方差: 组数据的方差: 其中, 是非组数据的算数平均值。 其中, 是每个等级区间的中点, 是所有观测样本的算数平均值,f为每个等级区间的频率。 四分位数偏差 处在数据25%和75%位置的观测值分别称为低四分位数和高四分位数(Q1和Q3)。对应四分位之间的范围(Q3~Q1)被称为半四分位数范围或四分位数偏差。 非组数据: 组数据: 运用QUARTILE函数求非组数据四分位数 QUARTILE(Array,Quart),其中Array为需要求得四分位数之的数足或数字型单元格区域,Quart决定返回哪一个四分位值。

文档评论(0)

woaitiantian + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档