- 1、本文档共38页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章 数据分布特征的描述2
第二节 分布离散程度的测度 离散趋势 定类数据:异众比率 定序数据:四分位差 定距和定比数据:极差、方差及标准差 相对离散程度:离散系数 一、极 差 1. 一组数据的最大值与最小值之差 2. 离散程度的最简单测度值 3. 易受极端值影响 4. 未考虑数据的分布 例:上述三个组计算全距: 甲组80 80 80 80 80的全距=80-80=0 乙组70 75 80 85 90的全距=90-70=20 丙组2 18 25 96 259的全距=259-2=257 则:因为020257 所以:甲组的平均数的代表性要比乙组和丙组的平均数的代表性大;甲组内部的稳定性要比乙组和丙组内部的稳定性要好。 二、方差和标准差 二、方差和标准差 1. 离散程度的测度值之一 2. 最常用的测度值 3. 反映了数据的分布 4. 反映了各变量值与均值的平均差异 5.根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差 (一)总体方差和标准差 未分组数据: 总体标准差(计算过程及结果) (二)样本方差和标准差 未分组数据: 样本方差自由度(degree of freedom) 一组数据中可以自由取值的数据的个数。 当样本数据的个数为 n 时,若样本均值?x 确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值。 例如,样本有3个数值,即x1=2,x2=4,x3=9,则 ?x = 5。当 ?x = 5 确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值。 样本方差(算例) 原始数据: 10 5 9 13 6 8 样本标准差(算例) 样本标准差 总体方差的简化计算公式 分组数据 样本方差的简化计算公式 方差(数学性质) 各变量值对均值的方差小于对任意值的方差 证明提示:设X0为不等于?X 的任意数,D2为对X0的方差,则: (三)标准化值 1. 也称标准分数 2. 给出某一个值在一组数据中的相对位置 3. 可用于判断一组数据是否有离群点(3σ) 4. 用于对变量的标准化处理 5. 计算公式为 例:比较身高 前NBA巨星Michael Jordan身高78英寸,而WNBA运动员R. Lobo身高76英寸,很明显Jordan高出2英寸,但谁相对来说高一些呢? (男性平均身高69英寸,标准差为2.8英寸;女性平均身高63.6英寸,标准差为2.5英寸) 三、变异系数 某地7岁男童身高均数为123.10cm ,标准差为4.71cm;体重的均数为22.29kg,标准差为2.26kg。 问:是身高的差异大还是体重的差异大 三、标准差系数(概念要点和计算公式) 1.标准差与其相应的均值之比 2.消除了数据水平高低和计量单位的影响 3.测度了数据的相对离散程度 4.用于对不同组别数据离散程度的比较 计算公式为 男童的身高与体重 身高Vσ=4.17/123.10=0.0383 体重V σ =2.26/22.29=0.1014 标准差系数(实例和计算过程) 标准差系数(计算结果) 案例:标志变异指标度量风险 1964—1976年台湾省各种投资工具报酬率比较 几种离散测度的比较 偏态与峰度分布的形状 偏态(概念要点) 1. 数据分布偏斜程度的测度 2. 偏态系数=0为对称分布 3. 偏态系数 0为右偏分布 4. 偏态系数 0为左偏分布 5. 计算公式为 偏度值α 一般在-3 ~ 3之间。 3为极度右偏斜 -3为极度左偏斜 绝大多数变量分布偏斜程度在-1~ 1之间 偏态(实例) 偏态与峰度(从直方图上观察) 偏态系数(计算过程) 偏态系数(计算结果) 峰度(概念要点) 1. 数据分布扁平程度的测度 2. 峰度系数=3为扁平程度适中 3. 峰度系数3为扁平分布 4. 峰度系数3为尖峰分布 5. 计算公式为 峰度系数(实例计算结果) α3=0 α30 α30 (对称分布) 正偏态分布(右) 负偏态分布(左) 【例3.16】已知1997年我国农村居民家庭按纯收入分组的有关数据如表4.9。试计算偏态系数 2.28 12.45 20.35 19.52 14.93 10.35 6.56 4.13 2.68 1.81 4.94 500以下 500~1000 1000~1500 1500~2000 2000~2500 2500~3000 3000~3500 3500~4000 4000~4500 4500~5000 5000以上 户数比重(%) 按纯收入分组(元) 表3-7 1997年农村居民家庭
您可能关注的文档
- 江苏省南京市2010届高三数学二轮复习的思路与建议(南京一中 孔凡海).ppt
- 沉淀条件的控制,沉淀的过滤、洗涤和溶解; 分光光度法测定钴含量.ppt
- 沥青混合料温拌技术在江西省高速公路建设中的应用 - 江西交通信息网.doc
- 沙漠中的飯店.ppt
- 河川的污染:二仁溪.ppt
- 测验常模的建立(新教材).ppt
- 浅水洼里的小鱼课件四.ppt
- 海跃庭院设计――石与草的舞蹈 庭院设计元素表现.doc
- 沒有專業相機,但我們一樣努力捕捉小魚的身影.ppt
- 汽车制动系的维护与故障排除.ppt
- 2024-2030年中国盐市场销售态势及未来营销趋势预测报告.docx
- 2024-2030年中国盐水浓缩技术市场前景展望与发展对策建议研究报告.docx
- 2024-2030年中国皱波角叉菜提取物行业运营状况与供需前景预测报告.docx
- 2024-2030年中国皮箱市场调研及重点企业投资评估规划分析研究报告.docx
- 2024-2030年中国皮下给药设备行业市场发展趋势与前景展望战略分析报告.docx
- 2024-2030年中国皮肤溃疡伤口护理产品行业市场发展趋势与前景展望战略分析报告.docx
- 2024-2030年中国男士黑色手表行业市场发展趋势与前景展望战略分析报告.docx
- 2024-2030年中国电缆探测器行业市场发展趋势与前景展望战略分析报告.docx
- 2024-2030年中国电池用铜线圈行业市场发展趋势与前景展望战略分析报告.docx
- 2024-2030年中国电极糊市场深度调研与发展趋势预测分析研究报告.docx
文档评论(0)