网站大量收购闲置独家精品文档,联系QQ:2885784924

27-一份SPSS回归分析与数据预处理的心得体会.pdf

27-一份SPSS回归分析与数据预处理的心得体会.pdf

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
27-一份SPSS回归分析与数据预处理的心得体会

数据小兵 数据小兵精选特供 一份 SPSS 回归分析与数据预处理的心得体会 时间:2015 年 3 月 8 日 | 栏目: SPSS 课堂 | 作者: 数据小兵 关于 SPSS 学习与交流的专业论坛,小兵博客一直推荐大家去人大经济论坛 SPSS 专版。这个板块几乎覆盖了 SPSS 统计分析从理论到实践、从工具到方法的 各类材料。特别适合 SPSS 初学者和使用者交流互动,传授经验。 今天小兵就先为大家分享一篇论坛网友 SPSS 数据分析的心得体会,原作者: xddlovejiao1314,谢谢他的宝贵经验分享。 关于 SPSS 数据预处理 拿到一份数据,或者在看到国内外某个学者的文章有想法而自己手里的数据 刚好符合这个想法可以做时,在整理好数据后不要急于建模。一定要对数据做缺 失值处理、异常值处理。在数据预处理的基础上再进一步建模,否则可能得到错 误的结果。 心得 1:数据预处理怎么做。 一是 缺失值的处理。我个人有几个看法: 数据样本量足够大,在删除缺失值样本的情况下不影响估计总体情况,可考 虑删除缺失值; 二是数据样本量本身不大的情况下,可从以下两点考虑:1 是采用缺失值替 换,SPSS 中具体操作为“转换”菜单下的“替换缺失值”功能,里面有 5 种替 换的方法。若数据样本量不大,同质性比较强,可考虑总体均值替换方法,如数 据来自不同的总体(如我做农户调研不同村的数据),可考虑以一个小总体的均 值作为替换(如我以一个村的均值替换缺失值)。2 是根据原始问卷结合客观实 际自行推断估计一个缺失值的样本值,或者以一个类似家庭的值补充缺失值。 数据小兵 | 1 数据小兵 数据小兵精选特供 心得 2:数据预处理第二点异常值的处理。 我大概学了两门统计软件 SPSS 和 Stata,SPSS 用的时间久些,熟悉一下, Stata 最近才学,不是太熟。关于这点我结合着来说。关于异常值的处理可分为 两点,一是怎么判定一个值是异常值,二是怎么去处理。 判定异常值的方法我个人认为常用的有两点:1 是描述性统计分析,看均值、 标准差和最大最小值。一般情况下,若标准差远远大于均值,可粗略判定数据存 在异常值。2 是通过做指标的箱图判定,箱图上加“*”的个案即为异常个案。 发现了异常值,接下来说怎么处理的问题。大概有三种方法: 1 是正偏态分布数据取对数处理。我做农户微观实证研究,很多时候得到的 数据(如收入)都有很大的异常值,数据呈正偏态分布,这种我一般是取对数处 理数据。若原始数据中还有 0,取对数 ln(0)没意义,我就取 ln(x+1)处理; 2 是样本量足够大删除异常值样本; 3 是从 stata 里学到的,对数据做结尾或者缩尾处理。这里的结尾处理其实 就是同第二个方法,在样本量足够大的情况下删除首尾 1%-5%的样本。缩尾指的 是人为改变异常值大小。如有一组数据,均值为 50,存在几个异常值,都是 500 多(我这么说有点夸张,大概是这个意思),缩尾处理就是将这几个 500 多的数 据人为改为均值+3 标准差左右数据大小,如改为 100。 总结而言,我个人认为做数据变换的方式比较好,数据变换后再做图或描述 性统计看数据分布情况,再剔除个别极端异常值。

文档评论(0)

haihang2017 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档