基于中值PCA和加权PCA数据分类的研究.docx

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2014年第2期文章编号:1009—2552(2014}02—0014—05 2014年第2期 文章编号:1009—2552(2014}02—0014—05 中图分类号:TIB91.41 文献标识码:A 基于中值PCA和加权PCA数据分类的研究 王德芬1,高建强1,李 莉2 (1.河海大学计算机与信息学院,南京210098;2.南京财经大学应用数学学院,南京210023) 摘要:在分析了传统主成分分析(PCA)方法的原理和实现方法上,提出了基于中值的主成 分分析新方法(MPCA)。另外,针对多类高维数据分类问题,较深入地研究了权函数对分类问 题的影响,对传统PCA模型进行加权处理得到加权主成分分析(WPCA)。实验结果表明,MP— CA比传统PCA具有较好的分类效果,不同权函数对数据的分类结果影响较大,且WPCA比传统 PCA在分类效果上有明显的优势。 关键词:PCA;MPCA;加权主成分分析;权函数;错分率 Studies on data classification based on median PCA and weighted PCA WANG De—fen 1,GAO Jian—qian91,LI Li2 (1.School of Computer and Information,Hohai University,Nanjing 210098,China; 2.Department of Applied Mathematics,Nanjing University of Finance and Economics,Nanjing 210023,China) Abstract:A new median-based principal component analysis method(MPCA)is pmposed under based the traditional principal component analysis(PCA)theory and implementing method introduced in this paper.In addition,the effect of weight function the classification problem is deeply researched for multi—class high·dimension data classification problem.And,weighted principal component analysis (WPCA)is obtained by applying the weighting method for PCA model.The experiment results show that the MPCA has got better result than the traditional PCA on the classification problem,the influence of different weight functions is great data classification result,and WPCA has obvious more advantages than the traditional PCA classification results. Key words:PCA;MPCA;weighted principal component analysis;weight function;misclassification rate 随着科技的发展,高维数据越来越受到人们的 维方法,但是它有一个完全依赖于每一类样本均值 关注。高维数据虽然蕴含丰富的信息,但是也含有 的弱点,在某些特殊情况下(当输人数据中含有噪 较多的冗余,给科研人员带来了分析和处理的困难。 声、强光、离群值等),每一类样本的均值不能准确 主要表现为:(1)数据维数较高,含冗余,计算耗时; 地估计整体样本的实际情况。因此,本文提出了一 (2)在处理某些特定问题时,能利用的有效信息较 种新的模型——基于中值的主成分分析(MPCA), 少,且在高维环境下,很容易被湮灭,因此对如何进 这一模型能够有效地克服这一弱点。科研人员在线 行有效信息的提取变得十分必要。对于以上提到的 性判别分析中已有相关的研究拉。j。文献[5—8] 两点,可以从以下两个方面进行考虑来加以解决:首 主要讨论了权函数对数据分类的影响,但是没有 先对原始高维数据进行适当降维;其次,对降维后的 收稿日期:2013—07一Ol 数据进行不同测度下的加权处理。目前关于数据降 基金项目:

文档评论(0)

小教资源库 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档