线性判别分析与主成分分析及其相关研究评述.pdfVIP

线性判别分析与主成分分析及其相关研究评述.pdf

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
线性判别分析与主成分分析及其相关研究评述.pdf

中山大学研究生学刊 自然科学、 学版) 第28卷第4期 JOURNAL OF THE GRADUATES VOL.28No4 2007 SUN YAT—SEN UNIVERSITY(NATURAL SCIENCES、MEDICINE) 2007 线性判别分析与主成分分析及其 相关研究评述 王晓慧 (中山大学数学与计算科学学院,07硕,广州,510275) 摘 要:线性判别分析 (LDA)和主成分分析(PCA)都在各个领域有着重 要的作用。他们各自抓住样本在特征空间的不同特征,一般情况下更趋向于使 用LDA,因为LDA直接处理类间的分析问题,而PCA则没有突出类的结构。 然而实验证明PCA在某些问题上叉明显优于LDA。于是,改进或结合使用 LDA与PCA成了非常必要的课题。现阶段在这个领域上已经有许多优秀的研 究成果,本文简单的介绍了其中几种效果较好的相关分析方法,其中叉以混合 判别分析 (HDA)最优。HDA不仅同时抓住了样本的判别信息和描述信息, 使PCA与LDA在各种情况下达到平衡,而且在二维参数空间中提供了一系列 的分析方法,更有利于解决小样本问题和高维问题。Boosted HDA的提出通过 用迭代的方法改进弱分类器,避免了HDA复杂的参数有哪些信誉好的足球投注网站,并得到一种统一 计算HDA的方法。文章将在第三部分引用一些已有的实验结果来验证HDA的 优越性。 关键词:线性判别分析;主成分分析;小样本问题;高维问题;混合判别分 析;混合判别分析改进 1 线性判别分析与主成分分析 1.1 线性判别分析 线性判别分析 (Linear Discriminant Analysis,简称LDA)是用于判断样品所属类型 的一种统计分析方法,它在医学诊断,气象学,考古学,经济学,市场预测,环境科 学,地质勘探,体育运动和农林虫害预报等领域中都起着重要的作用。它的基本思想是 投影,首先通过找出特征向量W,将k组m元数据投影到另一个更低维的方向,使得投 影后组与组之间尽可能地分开,而同一组内的关系更加密切,然后在新空问中对样本进 行分类。 收稿日期:2007—1 1—15 线性判别分析与主成分分析及其相关研究评述 如果假设所有的样本只来自两个不同的类 (记为P(positive)类和n(negative) 类),那么求最优特征向量W的问题可以表述为以下这个求最大值点的数学问题: l S8 l … 叩 g 其中, s =∑(m 一m )(m 一m ) 是类间离差阵, j · , s =∑( 一mx)( —mx) +∑(y 一my)(y 一my) 是类内离差阵; { ,i=1,…,,v }表示P类,{Y ,i=1,…,,v }表示n类; m 和m 分别表示P类和n类的均值。 以上讨论只有两类的LDA,也称FDA(Fisher Discriminant Analysis),下面讨论多于 两类的LDA——MDA(Multi—class Discriminant Analysis)。 1.2 主成分分析 主成分分析 (Principal Component Analysis,简称PCA)是将多指标化为少数几个综 合指标的一种统计分析方法。在实际问题中,观测到的数据在一定程度上反映的信息会 有所重叠,在高维空间中研究的样本分布规律也比较复杂,PCA的思想是用较少的综合 变量来代替原来较多的变量,同时要求这几个综合变量能够尽可能多地反映原来变量的 信息,并且彼此之间互不相关,进而再对新的变量进行统计分析。 类似地,PCA也可以表述为以下求最大值点的数学问题: t S

文档评论(0)

heroliuguan + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8073070133000003

1亿VIP精品文档

相关文档