- 1、本文档共14页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第4章节样本描述与数据准备
第4章 样本描述与数据准备
样本数据采集到以后,不能立即用于数据分析,因为样本可能存在错误数据、缺失数据或者异常数据,或者采集的数据不符合要求,不具有代表性,这些情况会直接影响到分析结果的准确性和准确性。所以,进行数据分析以前,需要首先了解一下样本数据的基本特征,并对缺失值和异常值等进行适当的处理。
第一节 样本的描述
一、基本数学知识
样本数据采集到以后,常用一些统计量描述原始数据的集中程度和离散状况,对数据的总体特征进行归纳。
(1)描述中心趋势的统计量
算术平均数:样本数据的总和除以数据个数得到算术平均数,算术平均数是描述样本数据中心趋势最常用的统计量,因为具有计算简便、稳定的优点。
中位数:将样本数据(假设有个数)按照升序或者降序排列,如果为奇数,则数列中间的数为中位数;如果为偶数,则中位数为居中两数的均值。中位数不如算术平均数稳定,即在同一总体中取相同大小的不同样本时,中位数的变化比算术平均数大。但是中位数不受极值的影响,因而在经济统计中应用较多。
众数:样本数据中出现频数最大的那个数称为众数。众数容易理解,但是不容易确定,与中位数一样,不受极值的影响。
截尾平均数:将样本数据进行排序后,按照一定的比率去掉两端的某些数,对剩下的数据求平均值,得到截尾平均数。常用的截尾平均数有5%截尾平均数,即两端去掉5%的数据以后剩余的数求平均数。截尾平均数与算术平均数相比,较少受极值的影响。
几何平均数:个非负数的几何平均数可以表示为:
几何平均数应用于任何两个相邻数之比为常数或者接近常数的数据资料。
调和平均数:个数的调和平均数可以表示为:
其它中心趋向的度量还有某种四分数、十分数和百分数的平均值。其中,分位数是随机变量的一种数字特征,假设连续型随机变量的密度函数是,给定常数 ,若满足:
则称为的分位数。
(2)描述离散趋势的统计量
仅仅利用描述中心趋势的统计量,不能够反映整个数据集合的分布状况,具有不同分布的数据可能具有相同的算术平均数、中位数或者众数等。因此,还需要统计量来反映数据与描述中心趋向统计量之间的离散状况。这样的统计量主要包括以下几种:
极差:极差是样本数据中最大值与最小值的差值,极值舍弃了最大值与最小值之间的数据信息,仅仅依靠端点值来确定,因而稳定性差。
平均差:样本数据中各数据与均值之间差值的平均数称为平均差。平均差应该为0,用它可以检验平均值的准确性。
平均绝对差:样本数据中各数据与均值之间的差值的绝对值的均值称为平均绝对差。
标准差:方差的平方根称为标准差,标准差是最常用的反映数据离散趋势的统计量。
(3)偏度与峰度
偏度:偏度是反映数据分布不对称的一个数字特征,其公式:
式中,,为变量的阶中心矩。当数据为正态分布时偏度为0。
峰度:峰度是以正态分布为标准描述该分布密度的形状为陡峭还是平坦的一个数字特征,计算公式为:
当数据呈现正态分布时,峰度为0。
二、SPSS实现
用鼠标指向Analyze菜单条中的Descriptive Statistics选项,打开响应的子菜单,该子菜单中提供了多个过程来实现样本数据的描述。下面分别进行介绍。
(1)频数分析过程
该过程就是通过数据频数分析来达到整理数据的目的,利用该过程,得到一系列描述数据分布状况的统计量。
对话框介绍
在Descriptive Statistics子菜单中单击Frequencies选项,打开Frequencies对话框,如下图所示;
变量名列表框:对话框左侧的变量名列出了当前数据文件中所有的变量的变量名。
Variable(s):在变量名列表框中单击文件名之后,单击对话框中间的箭头按钮,将变量名移到该列表框中。选定变量名后,将对选定变量的数据进行频数分析。
Display frequency tables:选定此项,将在查看器中显示频数分析表,否则只显示直方图,不显示频数表。
Statistics按钮:单击该按钮,打开Frequencies:Statistics对话框,如下图所示,该对话框中各个选项的意义如下:
1.Percentile Values方框:选择方框内的选项,计算并显示分位数。
Quartiles核选框 计算并显示四方位数。
Cut Points核选框 在后面的窗口中输入数值,假设为(为2到100之间的整数字),则计算并显示分位数。
Percentile(s)核选框 在后面的窗口中输入数值,可以有选择的显示百分位数。在窗口中可以输入0到10
您可能关注的文档
- 第3章体育锻炼与大学生的社会适应.doc
- 医学基本功积累︰化验单知识总结.docx
- 第3方物流配送优化战略.doc
- 医务科行评工作小结-doc22.doc
- 医学文献信息检索讨论课(2、3).doc
- 第3章创造性叛逆.doc
- 第3章从业人员职业道德.doc
- 第3章劳动关系的类型.doc
- 医学重点学科建设实施文案.doc
- 第3章各项所得的征税权分配规则.doc
- 5.3.1函数的单调性(教学课件)--高中数学人教A版(2019)选择性必修第二册.pptx
- 部编版道德与法治2024三年级上册 《科技提升国力》PPT课件.pptx
- 2.7.2 抛物线的几何性质(教学课件)-高中数学人教B版(2019)选择性必修第一册.pptx
- 人教部编统编版小学六年级上册道德与法治9 知法守法 依法维权(第一课时)课件.pptx
- 三年级上册品德道德与法治《学习伴我成长》.pptx
- 部编版小学道德与法治六年级上册6 人大代表为人民 课件.pptx
- 部编版小学道德与法治六年级上册1感受生活中的法律第一课时课件.pptx
- 2.5.2圆与圆的位置关系(教学课件)-高中数学人教A版(2019)选择性必修第一册.pptx
- 2.5.1直线与圆的位置关系-(教学课件)--高中数学人教A版(2019)选择性必修第一册.pptx
- 14.1.1 同底数幂的乘法(教学课件)-初中数学人教版八年级上册.pptx
最近下载
- 人教版三年级数学上册第四单元万以内加法和减法(二)单元分层作业设计.docx
- 党员组织关系转接培训课件.ppt VIP
- 考评员试卷A3(公共知识).doc
- 中职教育二年级上学期装备制造大类《射极跟随器》教学课件.pptx
- 图画书《我绝对绝对不吃番茄》.ppt VIP
- 供应链金融精华全解析 _ 史上最全关于表外融资与夹层融资详解.docx
- 《第二单元 魅力歌剧 演唱 猎人合唱》作业设计方案-初中音乐人音版九年级上册.docx VIP
- 热力管网直埋管道施工方案.pdf VIP
- 2024年山东“大学习、大培训、大考试”试题库(通用+工贸类).docx
- 小学科学苏教版五年级上册全册教案(2023秋新课标版).doc
文档评论(0)