- 1、本文档共62页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
单变量描述统计 学习提纲 频数与累计频数 集中趋势的度量 离散程度的度量 相对位置与异常值的检验 偏态与峰度的测度 频数与累计频数 频数——次数 对总体经过分组后形成各组单位数在各组间的分布。也就是各类别中的数据个数。 频数分布——次数分布,分布数列 总体中的各个类别及其相应的频数全部展示出来的数据集汇总表 定类数据 定序数据 定距数据 定比数据 累计次数分布 累计频数 向上累计 将各组次数和比率,由变量值低的组向变量值高的组逐组累计。 向下累计 将各组次数和比率,由变量值高的组向变量值低的组逐组累计。 参照P62表3-3 数据分布的特征 数据分布的特征和测度 集中趋势及其测度 集中趋势(Central tendency) 集中趋势(Central tendency) 众数 集中趋势测度值之一 出现次数最多的变量值 不受极端值的影响 可能没有众数或有几个众数 主要用于定类数据,也可用于定序数据和数值型数据 数值型分组数据的众数 出现次数最多的组作为众数所在组 众数的区间范围:众数所在组的区间 数值型分组数据的众数 中位数 集中趋势的测度值之一 排序后处于中间位置上的值 中位数(位置的确定) 未分组数据的中位数(计算公式) 定序数据中位数 数值型分组数据的中位数 四分位数 1. 集中趋势的测度值之一 2. 排序后处于25%和75%位置上的值 四分位数(位置的确定) 百分位数 P百分位数 p%的数据项的值小于等于P百分位数 (100-p)%的数据项的值大于等于P百分位数 均值 集中趋势的测度值之一 最常用的测度值 一组数据的均衡点所在 易受极端值的影响 用于数值型数据,不能用于定类数据和定序数据 均值 加权均值 甲乙两组各有10名学生,他们的考试成绩及其分布数据如下: 甲组: 考试成绩(X ): 0 20 100 人数分布(F ):1 1 8 乙组: 考试成绩(X ): 0 20 100 人数分布(F ):8 1 1 计算举例 某投资者某日选中5只股票的价格分别为:3.5元、4.1元、5.6元、9.8元和15.6元。 均值 1. 各变量值与均值的离差之和等于零 调和平均数 集中趋势的测度值之一 均值的另一种表现形式 易受极端值的影响 用于定比数据 不能用于定类数据和定序数据 计算公式为 几何平均数 集中趋势的测度值之一 N 个变量值乘积的 N 次方根 适用于特殊的数据 主要用于计算平均发展速度 计算公式为 众数、中位数和均值的比较 数据类型与集中趋势测度值 离散趋势及其测度 数据的特征和测度(本节位置) 离中趋势 数据分布的另一个重要特征 离中趋势的各测度值是对数据离散程度所作的描述 反映各变量值远离其中心值的程度,因此也称为离中趋势 从另一个侧面说明了集中趋势测度值的代表程度 不同类型的数据有不同的离散程度测度值 异众比率(定类数据) 离散程度的测度值之一 非众数组的频数占总频数的比率 计算公式为 异众比率(算例) 四分位差(定序数据) 离散程度的测度值之一 也称为内距或四分间距 上四分位数与下四分位数之差 QD = QU - QL 反映了中间50%数据的离散程度 不受极端值的影响 用于衡量中位数的代表性 四分位差(定序数据的算例) 极差 一组数据的最大值与最小值之差 离散程度的最简单测度值 易受极端值影响 未考虑数据的分布 平均差 离散程度的测度值之一 各变量值与其均值离差绝对值的平均数 能全面反映一组数据的离散程度 数学性质较差,实际中应用较少 平均差(计算过程及结果) 方差和标准差 离散程度的测度值之一 最常用的测度值 反映了数据的分布 反映了各变量值与均值的平均差异 各变量值对均值的方差小于对任意值的方差 根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差 总体方差和标准差 未分组数据: 总体方差和标准差 样本方差和标准差 未分组数据: 方差的数学性质 各变量值对均值的方差小于对任意值的方差 设X0为不等于?X 的任意数,D2为对X0的方差,则 离散系数 消除了数据水平高低和计量单位的影响 测度了数据的相对离散程度 用于对不同组别数据离散程度的比较 标准差系数: 平均差系数: 离散系数 离散系数 (计算结果) 数据类型与离散程度测度值 相对位置的度量 标准分数或Z分数 给出某一个值在一组数据中的相对位置 解释:某个变量值距离平均数的标准差个数 可用于判断一组数据是否有离群点 数据集之间可以进行比较
文档评论(0)