网站大量收购闲置独家精品文档,联系QQ:2885784924

第四讲.SPSS之数据描述.ppt

  1. 1、本文档共48页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四讲:SPSS之数据描述 同济大学社会学系 2011年 本讲内容 各种变量的描述及在SPSS中的实现 SPSS统计图表 多分类变量的统计描述 对变量分布的检验 列联表交叉分析 各种变量的描述及在SPSS中的实现 集中趋势 在一组统计数据中,往往用其中一个数值来代表本组数据的平均状况。 不同类型变量的集中趋势数值表示方法不同。定类变量一般用众值(mode)来表示它的集中趋势,定序变量用中位值(median),定距变量和定比变量用平均值来表示(mean)。 离散趋势 用一个或几个数据来表示整组数值偏离集中趋势的程度。 不同类型变量表示离散趋势的数值也有差异。如定类变量通常使用异众比率(=1-众数的频次/总频次),定序变量有四分位差、百分位差,定距(定比)变量有极差、方差、标准差等。 各种统计指标在SPSS中的实现 上述离散趋势指标和集中趋势指标都可以通过spss菜单来完成操作,具体方式:Analyze--Descriptive Statistics—Frequency(频数分析),打开对话框,选择需要分析的变量,点击statistics选择需要计算的统计值,continue返回;点击chart,可输出变量的一些简单统计图形;点击format,可以选中输出频数表的格式 操作过程 选择变量 选择待计算的统计值 选择图表类型 选择频数分布格式 SPSS统计图表 统计图表 SPSS中提供了各种类型的柱状图、折线图、直方图、散点图、箱形图和茎叶图等。 散点图在回归分析之前使用较多,用于查看变量分布特征; 箱形图和茎叶图,用于检查是否存在异常值; 其他类型图可在excel中实现,比较美观。 箱形图(box plot) 箱子的中间横线是数据的中位数(median),封闭箱子的上下两横线(边)分别为第三四分位数和第一四分位数。最上方和最下方的线段分别表示最大值和最小值。箱图最上方和最下方的星号、圆圈分别表示极端值。 茎叶图(stem-and-leaf plot) 特点是直观的反映了数据的原貌; 原理:将数值中不变或变化不大的数值作为茎(主干),将变化较大的数字作为叶,放在茎的后面。 箱形图和茎叶图可以通过analyze—descriptive statistics—explore分析过程来实现。Data11-7 箱形图和茎叶图的实现过程 箱形图 茎叶图 多分类变量的统计描述 多分类变量定义 多分类变量即是问卷中的多选题。根据固定选或不定选的差异,在定义多分类变量时方法稍有差异。 在固定选的多分类变量定义中,主要是累计所有可能的取值,累积的范围是该变量的所有编码。 在不定选的多分类变量定义中,主要是累计被访者选中的变量(编码是1的部分)。 新定义的多分类变量,不能保存,关闭数据库之后会丢失相关信息。下次分析时需重新定义。 多分类变量定义过程 频数分析 变量分布特征 常见变量分布 在很多统计模型中,对变量的分布有一定约束,如在回归分析中,要求因变量总体分布及子样本分布呈正态分布。 变量常见分布有:二项分布,多项分布,泊松分布、卡方分布、t分布、F分布、正态分布等等; 分布特征检验 可以通过P-P图和Q-Q图的方法来检验某变量的分布是否符合某一分布特征; 在结果显示中,如果某变量的实际累积频率和期望累积概率比较接近的话,则表明该变量符合某种类型的分布; 在SPSS15.0以上版本中,P-P图和Q-Q图在analyze—descriptive statistics—菜单下,以下版本在Graphs菜单下。 P-P图操作 P-P 图显示结果 Q-Q图操作 Q-Q图结果 偏度(Skewness) 是描述某变量取值分布对称性的统计量。具体的计算公式为 偏度为0表示其数据分布形态与正态分布偏度x相同;偏度大于0表示正偏差数值较大,为正偏或右偏,即有一条长尾巴拖在右边;偏度小于0表示负偏差数值大,为负偏或左偏,有一条长尾拖在左边。而偏度的绝对值数值越大表示分布形态的偏斜程度越大。 峰度(Kurtosis) 峰度是描述某变量所有取值分布形态陡缓程度的统计量。这个统计量是与正态分布相比较的量,峰度为0表示其数据分布与正态分布的陡缓程度相同;峰度大于0表示比正态分布高峰要更加陡峭,为尖顶峰;峰度小于0表示比正态分布的高峰要平坦,为平顶峰。具体的计算公式为 偏度和峰度在SPSS中实现 方法同频数分析; 在statistics对话框中分别选择峰度和偏度即可 选择偏度和峰度 列联表交叉分析 交叉分析 前面的分析都是对单个变量的数据分布情况进行分析。但在实际分析中,还需要掌握多个变量在不同取值情况下的数据分布情况,从而进一步深入分析变量之间的相互影响和关系,这种分析就称为交叉列联表分析。 交叉列联表分析除了列出交叉分组下的频数分布外,还需要分析两个变量之间是否具有独立性或

文档评论(0)

junjun37473 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档