- 1、本文档共12页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第2讲 新手入门指南
[GSW] Getting Started with Stata for Windows 新手入门指南
Stata是一个博大精深的(rich and deep)统计软件包,正如统计学本身的博大精深。新用户的最佳学习途径是练习手册上的每一个例子,在这方面花费时间多多练习会对今后从事真正的统计分析大有裨益(great benefit)。
Stata全部的官方指导手册都有一个符号标识:
[GSM] Getting Started with Stata for Mac
[GSU] Getting Started with Stata for Unix
[GSW] Getting Started with Stata for Windows
[U] Stata User’s Guide
[R] Stata Base Reference Manual
[D] Stata Data Management Reference Manual
[G] Stata Graphics Reference Manual
[XT] Stata Longitudinal-Data/Panel-Data Reference Manual
[ME] Stata Multilevel Mixed-Effects Reference Manual
[MI] Stata Multiple-Imputation Reference Manual
[MV] Stata Multivariate Statistics Reference Manual
[PSS] Stata Power and Sample-Size Reference Manual
[P] Stata Programming Reference Manual
[SEM] Stata Structural Equation Modeling Reference Manual
[SVY] Stata Survey Data Reference Manual
[ST] Stata Survival Analysis and Epidemiological Tables Reference Manual
[TS] Stata Time-Series Reference Manual
[TE] Stata Treatment-Effects Reference Manual:
Potential Outcomes/Counterfactual Outcomes
[ I ] Stata Glossary and Index
[M] Mata Reference Manual
Stata入门示例
第二讲将介绍几个Stata可以完成的基本任务,如打开一个数据集,调查数据集的内容,使用一些描述性统计,制作一些图表,并做一个简单的回归分析。这个方法应该给你一个直观印象:Stata可以做什么,以及Stata是如何工作的。会通过两种模式来进行:一是菜单和对话框模式;二是Stata命令行模式,这样就可以熟悉这两种模式。
一、打开示例文件:
1. 选择 File Example Datasets
2. 点击 Example datasets installed with Stata
3. 点击use for auto.dta
二、简单的数据管理
命令:browse(1快捷键;2菜单;3命令,三种方式)
数据窗口类似于Excel电子表格,纵列表示变量,横行表示观测值。
单元格中的数据有多种颜色:
数值型变量:黑色
字符串变量:红色
分类变量:蓝色
命令:describe (描述数据结构)
引申命令:notes (数据集的注释)
命令:summarize (变量的概要统计)
引申命令:codebook (更详细的描述数据集的结构、内容和变量值)
codebook make
codebook foreign
给分类变量/指标(虚拟)变量添加值标签有两个优点:第一,变量存储为1个字节占用更少内存,相反,存储字符串“Domestic”需要8个字节。第二,指标变量很容易纳入统计模型。
引申命令:codebook rep78
引申命令:browse if missing(rep78) (仅显示缺失值)
命令:list make if missing(rep78) [注意用法:if条件语句和missing()函数]
三、描述性统计
summarize price, detail
browse if price13000
tabulate foreign (一维频数表one-way table,借助了值标签和变量标签)
tabulate rep78 (一维频数表one-way table)
tabulate rep78 foreign
文档评论(0)