网站大量收购闲置独家精品文档,联系QQ:2885784924

多元统计剖析方法.docxVIP

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多元统计分析方法Ch1 基本概念1.多元总体:该总体有多个属性,可表示为X=,考察一个P元总体即是考察这个总体中每个对象的P个属性。2.多元样本数据:X=3.多元总体的样本统计参数:3.1 单总体3.1.1 分属性行样本统计参数样本平均值向量:中心化数据:原始数据-平均数标准化数据=中心化数据/该行样本标准差样本离差矩阵Q:Q=XX’,即两两中心化属性行乘积和,样本协方差矩阵S:S=Q/n=XX’/n(n为样本数)样本相关矩阵R:用X中的两行计算两属性间的相关,3.1.2 样本间统计参数各种距离:欧氏距离,马氏距离,B模距离,绝对距离,切比雪夫距离相似系数:定量:用X中的两列算出的相关系数;夹角余弦定性:首先转化为0,1型定性数据;对于p元总体的变量,两样本单元i,j配对情况有四种(1,1),(1,0),(0,1),(0,0),分别用a,b,c,d表示所有变量中这四种情况出现的次数。显然a,d出现的次数越多,两样本越接近。由此定义匹配系数:;修正的夹角余弦3.2 两总体(样本数均为n)两组样本的协方差矩阵:,Y与X的协方差矩阵,其中,注意两个样本的协方差一般不对称,即。小结多元总体该总体有多个属性,可表示为X=,考察一个P元总体即是考察这个总体中每个对象的P个属性多元样本矩阵X=多元总体的统计参数单总体分属性行样本统计参数样本平均值向量中心化数据原始数据-平均数标准化数据中心化数据/该行样本标准差样本离差矩阵Q样本协方差矩阵SS=Q/n=XX’/n(n为样本数)样本相关矩阵R用X中的两行计算两属性间的相关,样本间统计参数各种距离欧氏距离,马氏距离,B模距离,绝对距离,切比雪夫距离相似系数定量用X中的两列算出的相关系数夹角余弦定性首先转化为0,1型定性数据;对于p元总体的变量,两样本单元i,j配对情况有四种(1,1),(1,0),(0,1),(0,0),分别用a,b,c,d表示所有变量中这四种情况出现的次数。显然a,d出现的次数越多,两样本越接近匹配系数:修正的夹角余弦两总体(样本数均为n)两组样本的协方差矩阵,Y与X的协方差矩阵,其中,注意两个样本的协方差一般不对称,即。Ch2 主分量分析2.1主分量分析2.1.1原理:从变量着手分析,将原来多个指标化为少数几个相互独立的综合指标的一种统计方法。2.1.2数学表示:原变量X经正交变换U得到Y,Y=UX,使独立,且独立的随机变量中,具有最大方差。至于如何求U,的特征根,U’的第j列向量即为的特征向量。2.1.3 求解正交变换:实际中无法得到D(x),而是利用样本方差来求正交变换。2.1.4 贡献率:代表样本点在这个主分量方向上的分散程度,若其值很小,表示样本在该方向上的分散很小,这个主分量在分析样本数据时所起作用不大。2.1.5 因子负荷量:主分量与原分量相关系数称为第j因子在第k个主分量上的负荷量。几何解释为原坐标上单位长度在某个主坐标轴上的投影长度。其样本估计值为2.2 R分析:从标准化数据出发的主分量分析。2.3 q分析:从样本着手分析,2.3.1原理:压缩样本,找出典型的综合样本2.3.2 数学表示:仍然先求样本间的相似系数,再找V使得VQV’为对角矩阵,令Y=即得综合样本中的主分量。2.4 R型分析与Q型分析的联系令R=XX’,Q=X’X,u,v分别为R,Q对应的单位特征向量2.4.1 R,Q的非零特征根相同2.4.2 v=X’u, u=Ch3 其他简化数据结构及样本排序方法3.1 主坐标分析3.1.1 原理:构造坐标系,任两个样本在主坐标系中的欧氏距离等于事先给定的抽象距离。3.1.2 数学方法:有原始点对间的距离出发,根据两者变换关系,计算出每一样本点在新坐标系下的坐标为的矩阵A;求出A的特征根与特征向量;令C=3.2 主坐标分析与距离的关系并非任意给定的距离矩阵M均可找到其主坐标。3.2.1 欧氏距离从原始数据出发,采用欧氏距离计算M,主坐标分析与主分量分析相同3.2.2 绝对距离从原始0,1数据出发,按匹配系数决定的距离构成M,主坐标与主分量相同3.2.3 B模距离:主坐标分析总有解。3.3 数量化方法:3.3.1 原理:方差分析的方法(总方差固定条件下样本间方差最大化)同时排列样本与变量3.3.2 数学方法:有原始阵求行和gj,列和fi按公式计算Xji,A=XX’求特征根,特征向量,按公式计算变量得分与样本得分,所谓得分即是新坐标下的坐标值。Ch4 聚类分析4.1 聚类方法两种分类方案:系统聚类方法:n个样本分n类,找最相近的合并至只有k个类。系统分类法见表K,r合并为i后与j间距离统一递推公式:,最短距离法1/21/20-1/2最长距离法1/21/201/2中间距离法1/21/2-1/40重心法0离差平方和法0K近邻聚类:先将样本大致分为k类,再按某种规则逐

文档评论(0)

jdy261842 + 关注
实名认证
文档贡献者

分享好文档!

1亿VIP精品文档

相关文档