第九章对应讲述.ppt

  1. 1、本文档共39页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第九章对应讲述

列截面提取主成分:与行截面类似有 根据矩阵知识可知,∑r=ZZ’和∑c=Z’Z有完全相同的非零特征根,设为?1≥ ?2≥… ≥ ?p 设?1…?r为对应?1… ?r的∑r的特征向量,则有: 两边左乘Z’: (Z?j)即为对应?j的∑c的特征向量 这建立了R型因子分析与Q型因子分析的关系,且因∑r和∑c有相同非零特征根,因此提取公因子数和累积方差贡献都相同 四、对应分析的SPSS实现 分析→数据降维→对应分析 定义变量取值范围 模型: 提取因子数 主要分析行列变量的联系 输出统计量 列联表 行变量之因子载荷、方差贡献等 频数的行百分比 输出图形 行列变量对应图 行变量载荷图 行变量各分类因子载荷图 例:收入水平与学历 总惯量 非零特征根 累积方差贡献 ?2统计量及其p值 ?2 =n..×总惯量 显著:列联表行列之间有较强的相关性 边缘概率 因子得分 Ma Xin, North China Electric Power University Ma Xin, North China Electric Power University 内容提要 第九章 对应分析Correspondence Analysis 列联表(contingency table)分析 对应分析的基本思路 对应分析的理论推导 对应分析的SPSS实现 一、列联表分析 列联表contingency table 用来描述定类尺度和定序尺度数据的各种状态或是相关关系 从上表可以得到的信息:不同年龄顾客对公司产品的偏好、所有顾客整体评价、顾客结构、年龄结构与偏好的相关关系 两变量列联表的一般形式 频数 频率表: 边缘概率 边缘概率 联合概率:特性A第i种状态与特性B第j种状态出现的概率 两变量间相关关系的检验 如果变量A和B是独立的,则应有 检验假设: 如果拒绝原假设,我们希望进一步了解两变量各种状态之间的关系→对应分析 例:手机消费者产品偏好研究 列联表分析例:收入水平与PDA 分析→描述统计 → 交叉表… 显示频数分布柱形图 控制变量/分层变量 Cell: 单元格输出内容 显示观测频数 显示频率 显示行百分比 显示列百分比 显示总百分比 Statistics: ?2检验 列联表分析例:收入水平与PDA 频率表: row 随着收入的水平的提高,拥有PDA的人数增多 频率表:total 检验:不同收入水平拥有PDA数量上的差异是否来自于纯随机性? 检验结果:拒绝原假设,两变量间有显著相关性 控制第三变量:受教育水平 通常受教育水平越高,工资越高 收入与PDA的相关性实质上主要来自于受教育水平与PDA的相关性 受教育水平与PDA:控制收入水平 二、对应分析的基本思路:对行元素与列元素提取主成分 Row Profile Matrix Column Profile Matrix Principal Coordinates Can we put them on the same axes? Principal Correspondence Analysis 一个实例:郑州潜在手机顾客偏好调查 手机潜在用户:7个特征属性 4个年龄特征“18-25岁”、“26-35岁”、“36-45岁”、“46-55岁” 3个文化程度特征“初中以下”、“高中/中专”和“大学及以上”。 手机: 7个特征属性 “待机时间长”、“大显示屏”、“操作简单”、“外观时尚”、“功能强”、“价格合理”和“信号接收好”。 研究人员希望通过对应分析发现不同特征属性的手机潜在顾客对手机属性特征的偏好。 表一 潜在用户调研基础数据:行元素、列元素均为七维空间中的点 计算惯量,确定维度:行、列均简化到二维空间 各维度的惯量、奇异值 六个非零特征根 累积方差贡献 (1)行变量的主成分得分(投影) 计算行、列在各维度的得分(投影) 各水平样本数占总数比例 两主成分的变量共同度 (2)列变量的主成分得分(投影) 计算行、列在各维度的得分(投影) 对应分析图(定位图):行、列主成分得分放在一张图中 外观时尚 功能强 大显示屏 价格合理 接收信号好 待机时间长 操作简单 18-25岁 初中以下 46-55岁 高中/中专 大学及以上 26-35岁 36-45岁 (1)“初中及以下”学历:“操作简单”。 (2)年龄“18-25” 青年: “外观时尚” (3)年龄“46-55”之间、“高中/中专”学历:“大屏显示”。 (4)年龄“26-45”之间: “待机时间长”和“信号接收好”。 三、对应分析的理论推导 数据规格化: 行截面:Rp中的n个点 列截面:Rn中的p个点 数据规格化-续 行截面:概率加权坐标向量 样品间欧式距离 加权欧式距离 不同指标间数量级差异会开来困扰 间的欧式距离 可以看成点 : 行截面提取主成分

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档