《数据分析与STATA应用》教师题库.pdfVIP

《数据分析与STATA应用》教师题库.pdf

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

如无特别说明,本题库所使用的数据,均选取自中国综合社会调查(CGSS)2017

年的调查数据,数据名称为文件夹中的cgss2017_tiku.dta。

第三章Stata数据的读入与熟悉

1.创建一个新的log文件,保存在C盘的stata文件夹下,并且将其命

名为a1.smcl。

2.使用编程命令,在do文件中录入以下数据,创建新的数据库,并

将其保存为a2.dta:

MidIMCNoveltyChallenge

5555

3.333.333.333.67

4.6754.335

4444.67

3.打开cgss2017_tiku.dta,对数据进行整体的描述。该数据共有几个

变量?各自的变量名是什么?各自的存储类型是什么?

4.描述变量a10的基本内容,具体包括(1)变量的存储形式;(2)

取值范围;(3)独特取值的个数;(4)缺失值;(5)分类的个数及各

自的标签。

5.输出a8a,a69,a7a这三个变量第1000-1010样本分布情况。

6.以性别a2为排序变量对数据进行排序。

7.将变量c4,a36,v458放置于数据的最前面显示。

第四章变量的生成与处理

1.生成一个新变量age,计算公式为2017-a31。

2.用两种方法,根据变量a7a生成一个新变量edu,edu的分类标准

如下:

a7aedu

1,21

32

4,7,83

5,64

9-145

3.根据age,生成age的平方,新变量名为sage。

4.对于收入变量a8a有三类缺失值,即“不适用”“不知道”和“拒

绝回答”,请将以上三类缺失值重新编码为系统缺失值“.”。

5.新生成的年龄age取值范围是18岁至103岁,用两种方法,根据

年龄age生成新变量年龄组agegrp,具体分组为:

18岁-44岁为第一组,取值为1,“青年人”;

45-59岁为第二组,取值为2,“中年人”;

60-79岁为第三组,取值为3,“低龄老人”;

80岁及以上为第四组,取值为4,“高龄老人”。

6.根据age,描述年龄的均值,方差和标准差。

7.根据第5题的内容,为年龄组agegrp各分组添加相应的值标签。

8.将a2、a7a和a8a分别重新命名为性别sex、受教育程度edu和个

人年收入income。

第五章数据的合并、转换与集合

1.将文件夹下的数据data1.dta与data2.dta进行纵向合并,并回答:

(1)新生成的数据共有多少观察值和变量?

(2)其中,来自data1和data2的观察值各有多少?

2.选择合适的合并形式,以id为关键变量,以2008.dta为主要数据,

将文件夹中的2008.dta和2011.dta进行合并,并回答以下几个问题:

(1)有多少观察值分别来自主要数据、使用数据和同时来自两个数

据文件?

(2)新数据文件增加了多少个变量?

(3)合并后的数据是否有重复值?

(4)只保留匹配成功的观察值,将数据保存为新的数据库,命名为dta。

(5)将新数据的相关变量分别与两个原始数据进行比较,检查合并

的结果是否正确。

3.运用第二题合并之后的新数据dta,将此宽数据转换为长

数据,检验转换的结果是否正确,并回答:

(1)转换后的数据有多少个观察值?

(2)转换后的数据有多少个变量?

(3)转换后的数据变量有何变化?

第六章数据的描述

1.重新定义变量a2、a69和a36:

(1)将a2重新命名为sex。将sex原有的取值1替换为0,代表男性;

原有的取值2替换为1,代表女性。

(2)将a69重新命名为marriage。将marriage重新分组,其中将“未

婚”和“同居”合并为第一组(取值为1)代表未婚,将“初婚有配

偶”“再婚有配偶”“分居未离婚”合并为第二组(取值为2)代表已

婚,将“离婚

您可能关注的文档

文档评论(0)

133****6290 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档