单变量描述统计分析.ppt

  1. 1、本文档共76页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * * * * * * * * * * * * * * * * * * 适用于一定类变量、一定距变量的方法 其相关性检验方法是Eta系数(相关比)。该方法的核心思想类似于单因素方差分析。它将定类变量作为“控制变量”(Independent,解释变量),将定距变量当作观测变量(Dependent,被解释变量)。然后分析观测变量的变差中有多少比例是可以由控制变量解释的。 Eta系数的取值在0~1之间,越接近1,表示两变量的相关性越强。由此可知,Eta是属于PRE类的关联量数,基本上用于不对称的关系,但对称关系也可以使用。 * Eta相关比也可以用来测量两个连续变量之间的非直线关系。其做法是将其中的一个变量转换成类别变量,再用Eta来测量关联情形,若Eta值与相关系数之绝对值相差越大,显示两变量之间的关系越是非直线关系。 * 例: 结论:两变量无显著关联性。 * * 4.5 比率分析 Ratio 比率分析用于对两变量间变量值比率变化的描述分析,适用于定距变量。当研究者特别关心该比率在不同组间的变动情况是,该过程非常有用。 描述分析基本包括两大类:一类是集中趋势的描述指标,另一类是离散程度描述指标。 * 相对比分母的变量 分组变量 要求在结果窗口中输出分析结果 要求将分析结果存为外部数据 将数据按照分组变量值排序 相对比分子的变量 * 中位数 均数 加权均数 区间估计 平均绝对离差 离散系数 相关价格微分 基于中位数的变异系数 基于均数的变异系数 用于描述相比值落入某一区间所占的比例 自定义具体区间的上、下界 自定义距离中位数的百分比 * 集中系数 加权均数的算法为组内分子的均数除以分母的均数 * 4.4 多选项分析 多选项分析主要是针对问卷调查的多选项问题的。本节主要讨论多选项问题结果的保存(多选项问题的分解),以及多选项问题的频数分析。 多选项问题分解的两种办法:第一,多选项二分法;第二,多选项分类法。 频数分析的两步骤:第一,定义多选项变量集;第二,作多选项频数分析或交叉分组下的频数分析。 * Define Sets 指定变量集中的变量是按哪种方法分解的 为变量集命名 表示选中的数值 * Frequencies 注意:Spss规定只要样本在多选项变量集中的某一个变量上取缺失值,分析时就将该样本剔出。 * 279×3=837 * Crosstabs 行变量 列变量 定义变量的取值范围 * 分母为样本数 分母为多选项应答数 * * * * * * * * * * * * * * * * * * * 卡方检验注意事项 一,列联表的单元格不应太少,例如2×2的列联表需要进行连续型修正和采用Fisher精确检验进行校对。 二,各单元格中的期望频数,不应有期望频数小于1的单元格,或大量的期望频数小于5的单元格。若列联表中有20%以上的单元格的期望频数小于5,则一般不宜用卡方检验。此时,可以采用合并相邻单元格或采用似然率比卡方检验。 * * 三,总频数n应较大,一般至少大于50,大于100更好。在小样本是可主要参考连续性校正和Fisher的精确检验。 四、卡方值的大小会受到样本量的影响,若各个单元格中的样本数均等比例扩大10倍,于是卡方值也会随之扩大10倍。但由于自由度和显著水平没有改变,卡方的临界值不变,进而使拒绝零假设的可能性增高。即在样本量很大时,容易得到“两变量有关联”的结论,即便两变量的关联性很微弱时。 五、当行列变量都是定序型变量,可以参考线性相关卡方检验,该检验是检验两个定序的行列变量间是否具有线性相关性。 * 例: 结论:户籍 状况和房屋情 况有关联。 * 例: 结论:该列联表本身不 适合做卡方检验,一定 程度上可以参考似然比 卡方检验结果。但可以 考虑其他相关性检验。 * 关联分析 在关联分析中,对于关联指标的选择需要视变量的测量尺度和变量间的对称关系而定,而相关的检验则可以辅助了解两变数间的相关程度是否已经达到统计上的显著性。 关联分析应从相关研究或专业判断来建立理论基础,再辅以统计分析加以验证,不宜从数据分析的结果遂下结论,产生倒果为因的谬误。 * 关联分析的四大属性 对称性:自变量会影响因变量而因变量不会影响自变量的情形称为不对称关系,如教育程度和个人收入;两个变量会相互影响或不确定影响方向的情况称为对称关系,如工作满足感和工作绩效。 方向:指变量关联的变动方向,可以分为正负两个方向。只有两变量皆为定序以上时才会讨论关联方向。若有一变量为定类时,则无关联方向,其关联方向一律以正向表示。 * 关联强度:关联强度的侧度通常根据用自变量来预测因变量的准确程度来判断,若正确程度高表示两变项间的关联程度高,反之,则低。对于有关联方向的两变数,关联系数的值介于-1和1之间,关联系数的绝对

文档评论(0)

喵咪147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档