- 1、本文档共41页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
描述统计学ⅱ:数值方法
五数概括法 五数概括法(Five-number summary):是一种探索性数据分析的技术。用五个数据值:最小值、第1四分位数、中位数、第3四分位数和最大值来概括数据集。 * Graduate 6 5 1 4 12 7 11 9 2 3 8 10 Starting Salary 2710 2755 2850 2880 2880 2890 2920 2940 2950 3050 3130 3325 箱形图 画一个箱体,其边界恰好是第1和第3四分位数。这个方盒包含了中间的50%的数据。 在方盒上中位数的位置画一条垂线。因此中位数将数据分为相等的两个部分。 利用四分位点内距IQR =Q3-Q1,来设定界限。盒形图的界限定于低于Q1以下1.5个IQR和高于Q3以上1.5个IQR的位置。上、下限以外的数值作为异常值。 画一条须线从方盒的边线出发,直至在上、下限之内的最大值和最小值。 最后,任一异常值的位置以符号“ * ”标出。 * 箱形图(Box plot):一种用图形概括数据的方法。用一个以第 1和第3四分位数为边界的方盒来表明在中心位置的 50%的数据。以一条横线(称为须线)从方盒两侧延伸以表明大于第 3四分位数和小于第1四分位数的数据值的位置。所有异常值的位置也予以标明。 * 3 描述统计学Ⅱ:数值方法 位置的度量 变异程度的度量 相对位置的度量和异常值检测 探索性数据分析 两变量间关系的度量 加权平均数和使用分组数据 * 协方差 协方差(Covariance):用以衡量两变量间线性相关关系的数值量度。正值表示正相关,负值表示负相关。 总体协方差 样本协方差 * 例:一个音像设备商店数据的样本 * * * y = 51 x = 3 Ⅰ Ⅲ Ⅳ 相关系数 相关系数(Correlation coefficient):用以衡量两变量间线性相关关系的数值量度。其取值从–1到+1。接近+1的值表示强的正线性相关,接近-1的值表示强的负线性相关,接近零的值表示几乎无线性相关关系。 * 3 描述统计学Ⅱ:数值方法 位置的度量 变异程度的度量 相对位置的度量和异常值检测 探索性数据分析 两变量间关系的度量 加权平均数和使用分组数据 * 加权平均数 加权平均数(Weighted mean):将每一个数据值予以一个权重以反映其在数据集中的重要程度。由此获得的平均数即为加权平均数。 购买批次 每磅价格(美元) 购买数量(磅) 1 3.00 1200 2 3.40 500 3 2.80 2750 4 2.90 1000 5 3.25 800 * 分组数据 分组数据(Grouped data):将数据分为若干个组并配以频数分布,而不记录原始数据的个体值。 审计时间(天) 频数 10-14 4 15-19 8 20-24 5 25-29 2 30-34 1 * 分组数据样本平均数 分组数据总体平均数 分组数据样本方差 分组数据总体方差 * * * 3 描述统计学Ⅱ:数值方法 位置的度量 变异程度的度量 相对位置的度量和异常值检测 探索性数据分析 两变量间关系的度量 加权平均数和使用分组数据 * 平均数 平均数(Mean):衡量数据集中心位置的量度。用所有数据值相加的和除以项数计算。 如果数据来自某个样本,则其平均数以 表示;如果数据来自某个总体,则其平均数以希腊字母 μ 表示。 样本平均数 总体平均数 * 平均数 总体参数:用来概括总体数据的量度的数值。 样本统计量:用来概括样本数据的量度的数值。 * 中位数 中位数(Median):衡量数据集中心位置的量度。中位数的值将所有的数据分为两个相等部分,一部分的值都大于或等于它,而另一部分的值都小于或等于它。 奇数项:中位数是以递增顺序排列的所有数据项的正中央的那一项的数值。 偶数项:中位数就以递增顺序排列的所有数据项的正中央的两项的平均值。 * 中位数 衡量数据中心位置时,平均数的应用要更加普遍。但在某些情况下,平均数往往会受到极端大的或极端小的数值的影响。 例:在年收入及财产数据中,因为收入和财产中的少数极端值将会夸大平均数。在这种情况下,中位数成为更好的衡量中心位置的量度。 * 例:12名商学院毕业生的起始月薪数据样本 Graduate Starting Salary 1 2850 2 2950 3 3050 4 2880 5 2755 6 2710 7 2890 8 3130 9 2940 10 3325 11 2920 12 2880 平均数:$2940 中位数:$2905 10000 平均数:$3496 中位数:$2905 * 众数 众数(Mode):用以衡量数据的位置的量度,定义为发生频数最高的数据值。 有时发生频
您可能关注的文档
- 怒江傈僳族自治州(民俗民风).ppt
- 成才之路2015-2016学年高中地理 1.4《地域文化与人口》课件 湘教版必修2.ppt
- 总部基地案例分析--——中关村(丰台)总部基地二期规划出台历程及营销推广报告.ppt
- 成都七中精品课件 人教版必修二 第三章第一节 最简单的有机物 甲烷.ppt
- 我国乳油产品的现状与发展陈福良.ppt
- 我叫陈阿土!.ppt
- 我国生物质能发展现状及存在问题.ppt
- 我国农药进出口情况分析上海张文君.ppt
- 我国政府是人民的政府精品.ppt
- 我国的宗教政策(2015版).ppt
- 2024-2025学年度南阳农业职业学院单招考试文化素质数学考前冲刺练习题(精选题)附答案详解.docx
- 2024-2015年其他专卖店(GICSⅣ)行业均值、偿债、营运、盈利、发展、现金流能力均值.doc
- 2024-2025学年度全国统考教师资格考试《教育教学知识与能力(小学)》考前冲刺练习试题及答案详解.docx
- 2024-2025学年度全国统考教师资格考试《教育教学知识与能力(小学)》综合提升测试卷带答案详解(.docx
- 2024-2025学年度内蒙古能源职业学院单招考试文化素质数学能力提升B卷题库附答案详解(考试直接用.docx
- 2024-2025学年度内蒙古能源职业学院单招考试文化素质数学能力提升B卷题库附答案详解(考试直接用.docx
- 2024-2025学年度南充文化旅游职业学院单招考试文化素质数学测试卷及答案详解(考点梳理).docx
- 2024-2025学年度北海职业学院单招考试文化素质数学考前冲刺测试卷含完整答案详解(必刷).docx
- 2024-2015年其他专业服务(申万Ⅲ)行业均值、偿债、营运、盈利、发展、现金流能力均值.doc
- 2024-2025学年度全国统考教师资格考试《教育教学知识与能力(小学)》模拟题库及参考答案详解【培.docx
最近下载
- Sharp数据表紧凑型光学灰尘传感器.pdf VIP
- 重点语法知识梳理五:感叹句及100题(教师版)-2021-2022学年八年级英语上学期期末知识大串讲(牛津上海版).pdf VIP
- 初一数学导学案.doc VIP
- 猫瘟(猫泛白细胞减少症).ppt VIP
- 2022-2023学年八年级英语下学期期末考点大串讲(牛津上海版)重点语法知识梳理一:现在完成时及拓展专练50题(解析版).pdf VIP
- 2022-2023学年八年级英语下学期期末考点大串讲(牛津上海版)重点语法知识梳理二:宾语从句及拓展专练50题(解析版).pdf VIP
- 国家开放大学电大本科《数据库应用技术》2029-2030期末试题及答案(125精品.pdf VIP
- 《轻断食完整指南有效减肥和控制糖尿病的全饮食法》笔记.docx VIP
- 稳定期慢性气道疾病吸入装置规范应用中国专家共识解读课件.pptx VIP
- (高清版)B-T 15022.9-2022 电气绝缘用树脂基活性复合物 第9部分:电缆附件用树脂.pdf VIP
文档评论(0)