- 1、本文档共46页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章数据的概括性度量;第六、七章抽样推断与参数估计
应用统计学 课程安排 课程安排 第四章 数据的概括性度量(数据的描述统计分析) SPSS绘制的直方图 茎叶图和箱线图 解读茎叶图 茎叶图既给出数据大致的分布情况也给出原始数据的值。 从茎叶图可以看出数据是否对称、数据集中情况(众数、中位数)、数据的离散情况、是否有一些值远离其他的数等。 茎叶图不适合于数据量大的情况 SPSS图形:箱线图 箱线图——形象的展示连续变量的分布情况 箱线图通过5数反映连续 数据分布情况(Me,QL,QU, Max,Min) 如何看箱线图 (1)通过箱线图对连续变量 进行描述 (2)发现异常值(离群点) (3)如何应用箱线图对不同 类别的数据进行比较 描述性统计 在Excel中三个四分位数的位置分别是(n+3)/4,(n+1)/2,(3n+1)/4。 在主流教科书中的三个四分位数的位置分别是(n+1)/4,(n+1)/2,(3n+3)/4。 我们教材上的公式为n/4,(n+1)/2,3n/4。 解读茎叶图 茎叶图既给出数据大致的分布情况也给出原始数据的值。 从茎叶图可以看出数据是否对称、数据的离散情况、是否有一些值远离其他的数、数据集中情况等 茎叶图不适合于数据量大的情况 SPSS图形 SPSS图形功能概述 两种图形方法 (1)常规方法(Graphs-Bar…) (2)交互图(Graphs-Interactive-Bar…) 图形的种类 SPSS图形:条形图 SPSS图形:饼图 SPSS图形:箱线图 箱线图——形象的展示连续变量的分布情况 箱线图通过5数反映连续数据分布情况 如何看箱线图 (1)通过箱线图对连续变量进行描述 (2)发现异常值 (3)如何应用箱线图对不同类别的数据进行比较 SPSS图形:时序图 第六、七章 抽样推断与参数估计 一、抽样基本知识 二、抽样分布 三、抽样估计(参数估计) 一、抽样基本知识 1、概念回顾 2、抽样方法 3、抽样误差 概念 回 顾 统计推断 (statistical inference):从数据得到对现实世界的结论的过程。 抽样推断:从所研究的总体全部元素(单位)中抽取一部分元素(单位)进行调查,并利用样本统计量对总体某些性质或数量特征进行推断的过程。 估计 (estimation)和假设检验(hypothesis testing)是统计推断的重要内容。由样本数据对总体参数进行估计,即: 抽 样 方 法 概率抽样(随机抽样):按随机的原则,从总体抽出样本。每一个总体单位有一定的可能性被抽中。 ①简单随机抽样:完全随机地抽选样本,使得每一个样本都有相同的机会(概率)被抽中。 对于有限总体的简单随机抽样又可分为重复抽样与不重复抽样。 ②分层抽样 ③整群抽样 ④等距抽样 非概率抽样(非随机抽样):不遵循随机原则,而是按照人们的主观愿望抽选样本。 ①重点调查 ②典型调查 ③配额抽样 ④方便抽样 抽 样 误 差 抽样误差——抽样调查所得结果与总体真实数值之间差异 登记性误差——观察、测量、计算的差错,造假等 代表性误差——样本结构与总体结构不一致,样本不能完全代表总体 系统性误差——非随机因素引起样本估计量系统性偏差 随机误差(偶然性误差)——遵循随机原则抽样,但仍然存在样本结构不足以代表总体结构引起的样本估计量与总体参数之间的代表性误差 抽 样 误 差 实际抽样误差—某具体样本估计值 与总体参数 的真实值之间的离差( – ) 抽样平均误差— 是以 为分布中心的,即所有可能的样本估计值分布在总体参数周围。常用样本估计量平均差或标准差表示,反映了所有可能样本估计值与总体参数的平均差异程度(即所有可能样本的实际抽样误差的一般水平) 抽样极限误差—一定概率下抽样误差的可能范围(也称允许误差) 抽样极限误差 是一定概率下抽样误差的可能范围(也称允许误差)。 可以表述为不等式 。 表述为在一定概率下可认为样本估计量 与相应的总体参数 的误差的绝对值不超过 。 抽样极限误差是抽样误差的可能范围,而不是完全肯定的范围,这一可能范围的大小是与估计的可靠程度大小密切联系的。若要提高估计的置信度,则会增大允许误差,从而降低了估计精度;若要缩小允许误差,提高估计的精度,则会降低估计的置信度。 两者之间的具体联系可根据样本统计量的抽样分布来确定。(可参考教材第178页图) 二、抽样分布 每个随机变量都有其
文档评论(0)