多维数据的数字特征、相关分析.docVIP

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多维数据的数字特征、相关分析.doc

§1.3 多维数据的数字特征、相关分析 除单维分析外, 重要的是分量之间的相关分析. 1. 二维观测数据的数字特征、相关系数 设是二维总体, 样本 (1) 观测矩阵: (2) 二维观测数据均值向量 其中,; (3) 观测数据的方差、协方差 ,, , (4) 观测数据的协方差矩阵 (5) 观测数据的相关系数 , 1’. 二维总体的数字特征、相关系数 (1) 的分布函数; (2) 各自的方差; (3) 总体协方差; (4) 总体的相关系数; 数据的相关系数是总体的相关系数的相合估计,即 当时, 常有, 有失实意, 故需做 假设检验 . 已有结论: 当为二维正态且为真时, 则 , 值检验: 对于给定的, 若, 则拒, 即认相关. Pearson相关系数: 即. Spearman 相关系数 一种秩相关系数 数据的秩 在中的序号 例 样本数据: , 次序统计量: 秩统计量的值: 例’ 样本数据: , 次序统计量: 秩统计量值: 或 不惟一; 约定: 对于相同观测值, 同取各位置的平均值. 对例’, 秩统计量值: . 对于总体, 分别可得 关于的秩统计量: ; 关于的秩统计量: . 当相关性较强时,相应的秩统计量相关性也强 Spearman 相关系数 由秩的定义, 易得 经推算(略)得 , Spearman相关系数也可用于检验假设 (后面介绍). 在SAS系统中, 过程proc corr可计算 1) 多维数据两两间的Pearson和Spearman相关系数 2) 各对变量间相关系数为0的检验值 3) 多维观测数据的均值向量、协方差矩阵 例1.9对于20个随机选取的黄麻个体植株,记录其青植株重量与它们的干植株重量,设服从二维正态分布,其观测数据如下表(略). 求 1) 均值向量, 协方差矩阵; 2) Pearson相关系数, 并检验假设; 3) Spearman相关系数,并检验假设. 解: 调用 proc corr过程得 1) , 2) Pearson相关系数, 检验值 0.000 1,故与相关性是高度显著的 3) Spearman相关系数 检验值 0.000 1,与相关性也是高度显著的 2. 多维数据的数字特征及相关矩阵 1) 维总体 2) 个观测数据, 均值向量为; 3) 数据观测矩阵 ; 4) 观测数据的协方差矩阵 即. 5) 观测数据的Pearson相关矩阵 记 则有. 6) Spearman相关矩阵 7) 标准化数据处理 (标准化观测矩阵( 3. 总体的数字特征、相关矩阵、多维正态分布 设维总体, 1) 分布函数 2) 均值向量 3) 协方差阵 4) 相关矩阵 记 则 .. 4. 样本数据与总体的关系 先介绍随机向量的性质. 设,,则 1) 特别, 2) 特别 数据的分别是总体的的相合估计, 故当充分大时, 有. 数据的中位数向量 是总体的中位数向量的估计; Spearman相关矩阵是的稳健估计(抗扰) 5. 多维正态 (1) 概率密度 其中:. (2) 多维正态分布性质(证略) 1) 设,,则 2) 设, 分割后, 有 , 3) 设, 分割后, 与相互独立( (3) 多维正态最大似然法估计 设是来自总体的样本, 则的联合概率密度为 最大似然估计: 满足的 结果为 例1.10 对20名中年人测量3个生理指标,3个训练指标, 观测数据见表1.2 (部分数据) 求 (1)观测数据的均值向量,协方差矩阵,Pearson相关矩阵 (2)观测数据的中位数向量,Spearman相关矩阵; (3)分析各指标间的相关性. 解: (1) 调用proc corr过程, 得 (2) 调用proc corr过程, 得 (3) 若取显著水平, 则 由Pearsons相关矩阵, 得检验值的有 由Spearman相关矩阵, 得检验值的有 由此可知, 相应的变量对, 其相关性较小. 第1章 数据描述性分析 第 2 页 共 24 页

文档评论(0)

天马行空 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档