- 1、本文档共88页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第五章 数据的分组、合并与转换 本章主要内容 5.1.数据合并的类型和原理 5.2.纵向合并(append)——增加样本量 5.3.横向合并(merge)——增加变量 5.4.数据的转换 5.5.数据的分组 5.6.数据的集合 5.1.数据合并的类型和原理 内容相似的独立调查:城乡;性别 不同层次、不同年份的调查 母亲的数据与子女的数据 低层数据的高层特征 为什么需要合并数据 一个内容相同或类似的调查分别在城、乡进行,或在男性和女性间进行。数据也在不同地方由不同人员录入。若需比较城乡之间、性别之间在某些方面的差异,最好的方法之一就是将城乡样本合二为一,将男性和女性样本合二为一 个体居住的社会环境可能影响他们的日常生活和行为。越来越多的社会调查除了关注个体本身的差异外,也开始关注他们的生存环境,包括家庭和社区背景等。家庭寓于社区中,个人寓于家庭中。数据分析时,需要将分别录入的数据合并成包括不同层次、不同内容的数据 数据合并的类型 增加观察值(即样本量):纵向合并 若有一个城市儿童数据和一个农村儿童数据,二者的内容基本相同 可进行独立分析或整合后作为整体样本的次样本分析 增加变量:横向合并 若有一个社区数据和一个家庭数据,家庭寓于社区中,若想将二者合二为一,从而使家庭数据包含社区的基本特征,则需将数据进行横向合并 数据合并的窗口路径 数据合并的几个主要概念 主要数据(Master dataset):指当前在Stata界面的数据,又称当前数据(current dataset)、窗口数据或记忆空间数据 使用数据(using dataset) :指当前不在Stata界面、但行将被合并到当前数据的数据,也称辅助数据。该名词主要用于数据的合并 关键变量(Key variables),也称标识符(identifiers)或合并变量(match variables):横向合并的专有词汇,用来合并两个数据的变量。该变量必须同时存在于主要数据和使用数据中,且在使用前必须排序。主要变量可以是一个,也可以是两个或多个 扩大记忆空间的容量 由于合并数据将增加当前数据的观察值或(和)变量,扩大数据的占用空间,故在进行合并前,首先要确定是否有足够的记忆空间允许数据的合并 否则,可能遇到错误提示 Caution! Merging and appending both add data to the data already in Statas memory. It is easy to ask Stata to put more data in memory than youve allowed room for. Add together the sizes of all the files you want to merge or append before you combine them, clear and set memory if necessary, then combine the files. If not, you may get the message No room to add more variables/observations. 5.2.纵向合并(append) ——增加样本量 原理 将保存在某个盘符中的stata数据文件的内容追加到当前数据窗口的后面,生成一个新数据 在绝大部分的纵向合并中,用于两个数据库的格式和变量基本类似,但观察值却未必一样 观察值可以是独立的,来自于同一调查的不同样本,也可能不是完全独立的,来自于不同调查时间的相同样本 合并后,数据的变量基本不变,但观测个案增加了 该方法可以将两个或多个数据文件进行上下对接,简单明了,不易出错 方法 窗口路径Data–Combine datasets–Append datasets (纵向合并数据的对话框) 命令 . append using [使用数据的路径和名称] ① ② ①:纵向合并数据的基本命令 ②:使用数据的路径和名称(目前记忆空间的数据是主要 数据) 也可以只读入使用数据中的部分变量 . append using [使用数据的路径和名称], keep[变量名] ① ①:在合并使用数据时,只保留keep后面指定的变量 几点说明(I) 使用纵向合并的场合 纵向追踪调查 内容相同的调查在不同地区由不同人群完成 几点说明: 无需排序数据,因为无需按照任何标识符(identifier)进行各并,而只是将两个数据上下对接到一起 进行纵向合并时,Stata的log文件往往提示说,标签已经定义了。可以忽略 几点说明(II) 不同数据中,内容相同的变量需要有同样的名称。故在合并以前,分别描述数据: 若
您可能关注的文档
最近下载
- 2022年沪科版七年级数学下册第十章《10.3平行线的性质》课件.ppt
- 总量及各行业2024年中央经济工作会议解读.pdf VIP
- T∕CPHA 33-2024 通用码头和多用途码头绿色港口等级评价指南.pdf VIP
- 肿瘤患者心理护理PPT课件.ppt
- 2025年广东省基层住院医师线上岗位培训--全科学专业培训课程专业课答案.docx VIP
- 2023年广州市黄埔区教育局招考聘用铁英小学事业编制教师10人模拟预测(共500题)笔试参考题库附答案详解.docx
- 浅谈网络虚拟财产法律保护的现状及完善.doc
- SYB创业培训教案.pdf VIP
- 中西医结合内科学.pdf
- 2025年南京科技职业学院高职单招语文2018-2024历年参考题库频考点含答案解析.docx
文档评论(0)