- 1、本文档共70页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计检验的基本原理 两个类别出现了差异,这个差异从哪里来的呢? 第一种可能:来自随机误差 第二种可能:来自类别之间的结构性差异 统计检验的基本原理: 检查误差是不是超出了一定水平 统计量的抽样分布 T分布 正态分布 F分布) 均值比较:两个群体之间的关系 统计检验的基本原理 4 T-test假设,两个样本来自同一总体 则,任意两个样本的均值差构成一个分布(正态分布,样本较小时T分布) 则,某一变量上的均值差应该在抽样误差允许范围内 如果均值差在一定的自由度水平超出一定程度, 那么,假设不成立,这两个样本来自不同总体 均值比较:两个群体之间的关系 统计检验的基本原理 4 方差分析 假设样本来自同一总体 则,样本的均值和方差应该极为相似 如果,样本的均值和方差相差很大,超出一定范围,那么假设不成立。 实现途径: 以各样本的均值通过抽样分布来推测总体方差 以全部案例混合之后的修正方差来推测总体方差 如果以上两个方差推测值相差太大, 那么,样本均值差异太大(全部案例打乱之后推出的方差比较稳定)。至少有两个样本的均值不等。 均值比较:两个群体之间的关系 统计检验的基本原理 4 Compare means 各界面介绍! 均值比较:两个群体之间的关系 统计检验的基本原理 4 均值比较:两个群体之间的关系 统计检验的基本原理 4 均值比较中的方差比较: 补充:等级变量的双样本非参数检验 The Wald-Wolfowitz Runs test(连组检验)——当n1且n2大于20时可Z检验 The Wilcoxon-Mann-Whitney Test(U检验) (Kruskal-Wallis Test)序次变量的单因素方差检验(卡方检验) 均值比较:两个群体之间的关系 统计检验的基本原理 4 补充:等级变量的双样本非参数检验 PKU SPSS CLUB. * 主菜单中 File 文件管理菜单,完成对数据文件的建立、读取、存储、打印等操作。 Edit 文件编辑菜单,完成对数据文件的重新编辑、检索、拷贝、剪贴与替换等操作。 View 浏览编辑,完成文本或数据内容的状态栏、工具栏、字体、网格线以及数值标签等功能的操作。 Data 数据管理,数据的选择、排序菜单,包括对数据行的增加、合并、变量值的选择等 Transform 数据变换菜单,创建新变量、重新编码、计算同值的次数等。 Analyze 统计过程菜单,完成各种统计分析。 Graphs 统计图表,完成统计图表的建立与编辑 Utilities 实用程序,有关命令解释、字体选择、文件信息、定义输出标题和窗口设计等。 Windows 窗口控制,可进行窗口的排列、选择和显示操作 Help 帮助文件, 帮助文件的调用、选择和显示等操作。 描述性分析中的基本统计量 1 统计量搭配 统计描述 均值(定距) 众数(定类) 中位数(定序) 方差 异众比 四分位差 Frequencies过程 Descriptives过程 Explore过程 Crosstabs过程 SPSS中的描述性统计 1 一个比较好的网上教材:/news/spss/doc3/index.htm S.E.Mean: 标准偏差/根号n,它小于标准偏差,同一分布中抽取不同的样本,其均值的分布的偏差。如可以粗略地估计观察值与一个假定均值之间是否相符合,若S.E.Mean的绝对值小于等于2,可以认为这两个值不相等 基本操作练习—频次分析 2 基本操作练习——描述分析 2 对原始数据进行标准化,可以确定原始数据在总体分布中的位置,对不同分布的各种原始数据进行比较, 标准正态分布的均值是0,标准差是1,如Z=2, 表示这个值与均值(等于0)的距离是2个标准差,在总体中的位置是0.95。 在聚类分析及多元回归中都要用到标准分。标准化的意义在于过滤原始单位的影响。 基本操作练习——标准分 2 基本操作练习——探索分析 2 Stem-and-leaf:茎叶图,系统默认状态(这个图分为三个部分:频数、茎和叶,茎是整数部分,叶是小数部分,stem width表示茎宽, 每行的茎和叶组成的数字再乘以茎宽,就得到实际数据的近似值,实际数据中与这个近似值靠近的值的个数即为频数表示的个数。 基本操作练习——交互表 2 基本操作练习——读TXT文件,1 of 6 2 TXT文件的优点: 文件占空间比较小没有复杂的格式 基本操作练习——读TXT文件,2 of 6 2 基本操作练习——读TXT文件,4 of 6 2 基本操作练习——读TXT文件,5 of 6 2 基本操作练习——读TXT文件,6 of 6 2 Paste 工具的好处 可以调整后面的变量属性,不必多次使用向导! GET D
文档评论(0)