- 1、本文档共61页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
定类变量、定序变量、定距变量,定比变量: 定类变量:是指变量的取值即变量值只有类别属性之分,而没有大小、优劣之别。 定序变量:是指变量的取值,即变量值,除了有类别属性之分外,还有等级或次序的区别。 定距变量:是指变量的取值即变量值,除了具有类别、次序区别之外,还有类别之间、序列之间的标准化距离的变量。 定比变量:是指变量的取值,即变量值除具有定类、定序、定距等特征外,在变量取值中还有一个真正的零的变量即为定比变量。 * 用Pearsons卡方统计量进行统计检验时应注意的问题: 列联表的卡方检验用于检验两个分类变量的关联程度。卡方数值的大小与样本容量有关,在卡方检验中,需要报告关联系数;并且,在实际应用中还需注意卡方检验的条件,在有20%以上的理论次数小于5或有理论次数小于1时不能应用卡方检验;此外,在两个变量都是顺序变量时,两个变量的关联程度用Gamma检验比用卡方检验更好。 * trimmed mean:截尾均值 * 四、探索性分析 通过茎叶图(Stem-and-Leaf Plots)描述频度分布 茎叶图由数字构成,表达变量的频数分布。 在茎叶图中: 第1列表示频数,表示个案的个数 第2列表示茎叶图的茎,表达整数部分,其代表的数值与茎宽(Stem width)有关 当Stem=6,Stem width=10,实际表达的值是60 第3列表示茎叶图的叶子,表达小数部分,其代表的数值也与茎宽有关, Each leaf表示每片叶子的个案数 茎叶图中第1行数据表示的意义 表示有2个小于或等于55的极端值(Extreme) 茎叶图中第4行数据表示的意义 共有8个个案 值为75、76、77的个案各有1个 值为78的个案有2个 值为79的个案有3个 茎叶图中最后1行数据表示的意义 表示有2个大于或等于94的极端值(Extreme) 第1列 第2列 第3列 四、探索性分析 通过茎叶图(Stem-and-Leaf Plots)描述频度分布 例五:语文成绩茎叶图 数据文件:3-StudentScore.sav Analyze →Descriptive Statistics →Explore… (结果保存为:3-StudentScore_Stem-Leaf.spo) 选择输出统计表格和图形 1 2 3 通过箱图(Boxplots)描述数据分布 箱图也称为箱线图(箱式图),显示了变量数据的中位数、25%百分位数和75%百分位数,并给出偏离总体分布的奇异个案和极端个案。 四、探索性分析 箱图主体 箱图本体 中位数 通过箱图(Boxplots)描述数据分布 奇异值: 某个数据距离箱体主体边缘的距离超过箱主体高度的1.5倍,称为奇异值,在箱图中用○表示。奇异值分为上奇异值和下奇异值。 极端值: 某个数据距离箱体主体边缘的距离超过箱主体高度的3倍,称为极端值,在箱图中用★表示。极端值分为上极端值和下极端值。 四、探索性分析 通过箱图(Boxplots)描述数据分布 四、探索性分析 通过箱图(Boxplots)描述数据分布 语文成绩箱图 四、探索性分析 排序后 通过箱图(Boxplots)描述数据分布 例六:语文成绩箱图(数据文件:3-StudentScore.sav) (结果保存为:3-StudentScore_Box.spo) 四、探索性分析 1 2 3 四、探索性分析 通过正态分布检验的Q-Q概率图描述数据分布的正态性(有两种) (1)正态概率图以变量(语文成绩)的观测值为X轴坐标,以该变量分布的Z分数为纵坐标。斜线为正态分布的Z分数的期望标准线,若观测点离线越近,表示点越符合正态分布。反之,越不符合正态分布。 四、探索性分析 通过正态分布检验的Q-Q概率图描述数据分布的正态性 (2)反趋势正态概率图也是以变量(语文成绩)的观测值为X轴坐标,以该变量分布的Z分数与正态分布期望值的偏差为纵坐标。水平直线为期望标准线,若观测点离线越近,表示该点越符合正态分布。反之,越不符合正态分布。 四、探索性分析 通过正态分布检验的Q-Q概率图描述数据分布的正态性 例七:语文成绩正态分布检验的Q-Q概率图 (数据文件:3-StudentScore.sav) Analyze →Descriptive Statistics→Explore… (结果保存为:3-StudentScore_Q-Q.spo) 1 2 3 四、探索性分析
文档评论(0)