- 1、本文档共131页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SPSS统计软件学习 1 统计变量集中趋势的测定 定义:统计数据的集中趋势是指数据向其中心值靠近或集中的趋势 测定集中趋势的作用 1)反映总体各单位变量分布的集中趋势和一般水平 2)比较同类现象在不同单位的发展水平 3)比较同类现象在不同时期的发展变化趋势或规律 4)分析现象之间的依存关系 测量集中趋势的度量:位置平均数和数值平均数 位置平均数 众数(Mode):总体中出现次数最多的那个变量值,众数在描述数据集中趋势方面有一定的意义。例如,制鞋厂可以根据消费者所需鞋的尺码的众数来安排生产。 求某医院当天出生新生儿的体重的众数,数据如表1-1所示。 四分位数:将一组个案由小到大(或由大到小)排序后,用3个点将全部数据分为四等份,与3个点上相对应的变量称为四分位数,分别记为Q1(第一四分位数)、Q2(第二四分位数)、Q3(第三四分位数)。其中,Q3到Q1之间的距离的一半又称为四分位差,记为Q。四分位差越小,说明中间的数据越集中;四分位差越大,则意味着中间部分的数据越分散。 频数(Frequency):一个变量在各个变量值上取值的个案数。如要了解学生某次考试的成绩情况,需要计算出学生所有分数取值,以及每个分数取值有多少个人,这就需要用到频数分析。 变量的频数分析正是实现上述分析的最好手段,它可以使人们非常清楚地了解变量取值的分布情况。 例子 10个学生在某次数学、语文、化学考试中成绩如表1-3所示,试求学生在3门课程上的频数分布。 数值平均数 算术平均数(mean):是表现数据的集中趋势和代表性水品,基本形式为总体标志总量比上总体单位总数。例如,学生某门学科的平均成绩、公司员工的平均收入、某班级学生的平均身高等。 加权算术平均数(weighted mean):主要用于数据已经分组,并编制出次数分布的条件下,这时必须先将各组标志值乘以相应的次数,得到各组的标志总量,然后再相加得到总体标志总量。 2 统计变量离散程度的测定 集中趋势是统计总体数据特征之一,但由于个体的差异性,总体中的各数据还呈现相分散的离中趋势,因此对数据的统计分析,除了要反映其分布的集中趋势外,还要反映数据的离散程度,以到达对数据变动规律的全面描述。 定义:离散程度是度量统计分布离中趋势的指标,同时反映了总体中各个单位标志值的变异程度和平均数的代表水平。 测定变量离散程度的作用 1)反映现象总体中变量分布的离中趋势 2)衡量均值的代表性 3)测定现象变动的均匀性或稳定性程度 测量离中趋势的度量:极差﹑平均差﹑四分位差﹑方差﹑标准差﹑离散系数等 极差(range):又称全距,离散程度的最简单测度值,是最大和最小变量值之间的距离在相同样本容量情况下的两组数据,全距大的一组数据要比全距小的一组数据更为分散。 例子,某地农民人均年收入最高是8000元,最地是2600元一年,则该地区农民收入的极差是8000-2600等于5400元 。 方差(variance):所有变量值与平均数偏差平方的平均值,它是测定离散程度最常用的指标,离散程度最灵敏的指标。 标准差(standard deviation): 它是方差的平方根。它表示了一组数据关于平均数的平均离散程度。 方差和标准差越大,说明变量值之间的差异越大,距离平均数这个“中心”的离散趋势越大。 四分位差(quartile deviation): 分位差是极差的一种改进,四分位差是在数列中剔除最大和最小各四分之一的数据,是第一和第三个分位数之间距离的二分之一,表明中位数到这两个四分位数的平均距离,是说明中位数代表性高低的测量值。 平均差(mean absolute deviation): 是分配数列中各单位标志值与其计算平均数之间离差绝对值的平均数。 离散系数:适用于比较不同现象或不同水平数据的变异程度的情况。 3 变量分布偏度与峰度的描述 集中趋势和离中趋势是数据分布的两个重要特征,但是要全面了解数据分布的特点,还要知道数据分布的形态特征。 偏度:指分布不对称的方向和程度。偏度指标为α,α=0 数列分布为正态分布 α0数列分布正(右)偏分布 α0数列分布负(左)偏分布 峰度:指分布图形的尖峭程度或峰凸
文档评论(0)