- 1、本文档共32页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Lesson 2 数据录入与数据获取 *如何将数据录入SPSS中 *如何将其他格式的数据读入SPSS中 一. 数据是怎样得到的? 可从报纸、电视、互联网、年鉴等方面看到各种数据,并且从这些数据可以提取对自己有用的信息。 他们如同间谍,收集各种情报 他们很舍得在这方面花钱。因为市场信息数据是企业生存所必需的,绝不是可有可无的。 二. 收集数据时的误差 一勺八宝粥中的成分比例和整锅不尽相同,可能稍微多些或稍微少些。这是很正常的,因为样本的特征不一定和总体完全一样 这种差异不是错误,而是必然会出现的抽样误差(sampling error)。 和抽样误差不一样,未响应误差和响应误差都会影响对真实世界的了解 应该在设计调查方案时和进行调查过程中尽量避免 统计工作的操守准则 统计工作的操守准则 三.数据录入基本原则 1. 不同观察对象的数据不能在同一条记录中出现,即同一观测数据应独占一行 四.数据的直接录入 ◆数值型 应用最为广泛,分为标准数值型(Nnmeric)、逗号数值型(Comma)、圆点数值型(Dot)、科学计数法型(Scientific Notation)、美元数值型(Dollar)、用户自定义型(Custom Currency)。 上述四种测度的变量分别表示了不同的测量等级,等级高的应用范围广泛,等级低的应用范围受局限。测度低对事物属性的描述就是定性的,即只能研究到事物的某些属性的存在和分布情况,不能研究到事物属性的量化程度。测度高对事物属性的描述既可以是定性的,也可以是定量的。 由于定类变量和定序变量的测度低,属于定性描述的变量。定距变量和定比变量测度高,属于定量描述的变量。 定性描述通常仅分析到数据的频数、频率以及不同分布情况,还可以作为分组变量讨论其他变量的描述统计量。而定量描述则不仅可以分析其平均值、方差等分布参数,而且可以对不同的分组做比较性研究和更高级的研究。 四.外部数据的获取 五.数据的保存 * * 这些间接得到的(并非自己收集的)数据都是二手数据。 获得第一手数据要困难得多 某些在华的外资企业每年至少花三四千万元来收集和分析数据 在自然的未被控制的条件下观测到的数据,称为观测数据(observational data)。 在人工干预和操作情况下收集的数据就称为试验数据(experimental data)。 同学们自己可以举出大量的观测数据和试验数据的例子 抽样调查中,人们因为种种原因没有对调查做出反映,这种误差称为未响应误差(nonresponse error)。 一些人因为各种原因回答时并没有真实反映他们的观点,这称为响应误差(response error)。 2. 每一个测量指标/影响因素只能占据一列的位置,即同一个指标的测量数值都应当录入到同一个变量中去 3. 最终的数据集应当能够包含原始数据的所有信息 注:有时可以出现违反这些原则的例外情况,如重复测量数据 数据录入三部曲 { 定义变量名 指定变量各种属性 录入数据 { 变量类型 测量尺度 变量名与变量值标签 缺失值 其他 1.变量类型(Type) ◆字符型(String) 区分大小写字母,不能进行数学运算,所以分析、整理都较困难。 ◆日期型(Data) 实际上是特殊的数值型变量,用来表示日期或时间。 2.数据变量的测度(Measurement) ◆定类尺度(Nominal Measurement) 又称无序分变量。其观测值既无大小之分,又无等级或次序之分,仅是按某种属性对其进行分类。像:性别、部门单位或国家地区等。数据可以是数值型及字符型。但不能进行加、减、乘、除等数学运算。这类变量是测度最低的变量。 ◆定序尺度(Ordinal Measurement) 又称有序分变量。其观测值尽管大小没有特定意义,但属于顺序计量类型,适合于按照顺序排列的变量。像:名次、级别、职务等变量。观测值彼此之间的次序是有一定意义的,打乱定义将产生错误。数据可以是数值型及字符型。但同样也是不能进行加、减、乘、除等数学运算的。 ◆定距尺度(Interval Measurement) 区间变量。其观测值具有等级和次序之分。即观测值的大小和次序具有可比性,可以反映观测值之间的大小差异。但该类变量的观测值是在特定区间上有意义,超出该区间将没有意义。只可以用数值型变量表示。可进行加减运算。 ◆定比尺度(Scale Measurement) 比例变量。按照一定间隔、比例计量数据的变量类型。如:长度、质量、重量等变量,其观测值“零”也是有定义的。观测值之间可以进行加、减、乘、除的四则运算。数值型变
您可能关注的文档
- ,电磁感应定律动生电动势和感生电动势.ppt
- 数学归纳法课件人教A选修.ppt
- 信息系统分析和设计信息系统建设概论B.ppt
- 三级上册数学四边形整理复习.ppt
- 一本通届高考数学一轮复习数列求和课件理.ppt
- 届高考一轮复习数学数学归纳法.ppt
- 真正的哲学都是自己时代的精神上的精华人教版必修.ppt
- 历史《世界经济的区域集团化》课件新人教版必修.ppt
- 数学一轮复习.ppt
- 模型偏差补偿控制22.ppt
- 中国国家标准 GB/T 45154-2024老龄化社会 年龄包容性劳动力通用要求与指南.pdf
- 《GB/T 45154-2024老龄化社会 年龄包容性劳动力通用要求与指南》.pdf
- 中国国家标准 GB/T 7019-2024纤维水泥制品试验方法.pdf
- GB/T 7019-2024纤维水泥制品试验方法.pdf
- GB/T 45150-2024老龄化社会 认知症包容性社群框架.pdf
- 中国国家标准 GB/T 25320.4-2024电力系统管理及其信息交换 数据和通信安全 第4部分:包含MMS的协议集及其附件.pdf
- 中国国家标准 GB/T 45150-2024老龄化社会 认知症包容性社群框架.pdf
- 《GB/T 25320.4-2024电力系统管理及其信息交换 数据和通信安全 第4部分:包含MMS的协议集及其附件》.pdf
- 《GB/Z 44938.1-2024机械电气安全 第1部分:用于保护人员安全的传感器》.pdf
- 中国国家标准 GB/T 21551.3-2024家用和类似用途电器的抗菌、除菌、净化功能 第3部分:空气净化器的特殊要求.pdf
文档评论(0)