网站大量收购闲置独家精品文档,联系QQ:2885784924

高级统计方法简介预览.ppt

  1. 1、本文档共21页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
高级统计方法简介 汇报提纲 数据的分类 统计方法的分类体系 各种统计方法简介 推荐书目 1 数据的分类 定类变量(名义数据) 定序变量(等级数据) 定距变量(间距数据) 定比变量(比例数据) 2 统计方法的分类体系 关系类型? 2 统计方法的分类体系 事件史分析 3.1 因子分析 主要功能:缩减变量数(降维) 基本步骤: 计算所有变量相关矩阵,判别是否适合因子分析(相关矩阵大部分相关系数大于0.3适合;反映像相关矩阵很多元素值较大不适合;Bartlett test of sphericity显著;KMO0.7以上) 提取公共因子(常用主成分分析法) 因子旋转(便于为公共因子命名,常用Varimax) 一种重要用法:评价 3.2 聚类分析 主要功能:对研究对象进行分类 基本步骤: 选择变量(注意克服“加入尽可能多的变量”的倾向;所选变量之间不应高度相关) 计算相似性(相关测度——pearson相关系数;距离测度——欧式距离**、绝对值距离、明科夫斯基距离、马氏距离;关联测度*——简单匹配系数、雅克比系数、果瓦系数) 聚类(层次聚类——聚集法、分解法;迭代聚类/快速聚类) 聚类结果的解释与证实 3.3 对应分析 主要功能:揭示定性/非测量变量之间的联系 基本步骤: 对定性/非测量型变量进行交叉汇总,得到对应分析要求的汇总表(注意检查Crosstabs中是否有频数为零的单元格) 运行程序(Analyse?Data reduction? correspondence) 检查运行结果和各种统计图,看是否已反映变量关系;若否,调整参数重新运行 解释分析结果 3.4 多元线性回归 主要功能:分析一个测量型因变量与多个自变量之间的线性关系 注意事项: 因变量必须是测量型随机变量 若自变量为非测量型,则需设置虚拟变量 重点是回归模型的各项检验(整体线性拟合度检验——方差分析+判定系数R^2;回归系数的检验——T检验;多重共线性的检验——容忍度和方差膨胀系数;残差项异方差检验和自相关检验) 难点:多重共线性、异方差和自相关的诊断和排除 3.5 Logistic回归 主要功能:分析一个定性因变量与多个自变量之间的关系 注意事项: 因变量是非测量型二值变量;若自变量为非测量型,也需设置虚拟变量 重点是回归模型的各项检验(整体检验——对数似然比的卡方检验;回归系数的检验——Wald统计量的卡方检验;系数子集的联合假设检验——对数似然比的卡方检验) 难点:回归系数的解释(以logit p方程的线性表达式来解释;以发生比的指数表达式解释√) 3.6 鉴别分析 主要功能:进行统计鉴别和分组(根据一些已经分组的已知案例建立鉴别函数,然后根据鉴别函数对所有案例重新分组) 注意事项: 因变量是非测量型的分组变量;自变量是用以分组的特征变量称为鉴别变量 重点掌握鉴别分析模型即鉴别函数的各参数指标及统计检验(非标准化鉴别系数、标准化鉴别系数;结构系数/鉴别负载;鉴别力指数/方差百分比、残余鉴别力——Wilk’S lambda;Fisher鉴别系数) 3.7 对数线性模型 主要功能:通过数学方法来描述多个分类变量的交互频数分布;可以在控制其他变量的情况下研究任意两个变量之间的关联 注意事项: 对数线性模型包括三类分析程序:分层模型分析(从饱和模型入手得到简约模型)、一般模型分析(检验简约模型能否准确拟合观测数据并推断总体)和logit 模型分析(直接服务于分类变量之间的因果关系) 运用不同的模型,变量设置、项目设置均不同,能够提供的功能类型也不同(整体检验、分层检验、单项偏关联检验、自动筛选、参数估计、Z值、置信区间、观测频数、期望频数、残差) 3.8 典型相关分析 主要功能:两组变量之间的相关分析 注意事项: 它描述的是两个变量组之间的整体的相关形式; 要求两组变量之间为线性关系,即每对典型变量之间为线性关系;每个典型变量与本组所有观测变量的关系也是线性关系。如果不是线性关系,可先线性化(如取对数);所有观测变量为定量数据,定性数据按照一定形式设为虚拟变量后也可放入典型相关模型中进行分析 3.9 多元方差分析 主要功能:同时分析和检验不同类别在多个测量型变量上是否存在显著差别 注意事项: 因变量有多个且必须是测量型变量,自变量是非测量型变量 因变量应为正态分布且方差相等,而且需要存在一定程度的线性相关 例:Income、EduRatio、Natinality、Rural可构建单因素二元模型、双因素二元饱和模型、双因素二元非饱和模型 3.10 路径分析 主要功能:确定多个变量之间的因果关系是否存在或因果关系强弱程度 注意事项: 实质内容就是计算路径系数(=标准回归系数,可通过回归分析得到)、残值项路径系数(=根号下1-R^2,通过回归分

文档评论(0)

4753333 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档