网站大量收购独家精品文档,联系QQ:2885784924

数据降维中若干题的研究及应用.pdf

  1. 1、本文档共101页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据降维中若干题的研究及应用

数据降维中若干问题的研究及应用 专业: 计算机软件与理论 姓名: 陈国明 导师: 印鉴教授 摘要 如何降低数据的维数而不损失原有数据的内在信息是数据挖掘和机器学习 领域中的经典问题,降维是指样本从高维输入空间通过线性或非线性映射投影到 一个低维空间,从而找出隐藏在高维观测数据中有意义的低维结构,解决高维数 据的维数“灾害问题。基于子空间的学习和流形学习算法吸引了大量研究者, 成为本领域的热点问题。 本文主要讨论了数据降维过程中的三个方面的问题: kernel 1.在图嵌入框架的基础上提出一种新的降维分析算法IKLDA(improved Lineardiscriminant analysiS),不仅使得隐藏在图像的信息能被区分出来, 而且大大降低了数据的维数,理论分析及实验结果表明IKLDA的降维隐写分 析是有效的,比其它传统降维方法效果要好,并且进一步推进了数据挖掘可 视化方法在隐写分析的应用。 2.在数据集的内在维数的确定方面提出一种以反向k近邻为基础的最大似然维 数估计算法,弥补了低维流形在七近邻中形成短路问题的不足之处以及数据 密度不均匀给维数估计带来偏差问题,在人造数据集和真实数据集的维数估 计中,取得了较好的效果。与此同时,提出了一种基于粒子群优化算法的维 数及近邻大小的参数优化策略PSO—LLE,通过智能计算来估计数据的内在维 数和近邻的大小。 3.提出一种基于纹理特征的非线性降维算法Gabor—LLE,对中文手写笔迹进行 分析处理。首先对手写笔迹图像进行预处理,然后用gabor滤波器提取出特 征,最后用流形学习算法LLE进行降维分类,取得了较好的效果。 关键词:降维,维数估计,流形学习,可视化 Researchand of several application indata reduction problemsdimensionality Software Major: Computer Theory Name: Chen guoming Jian Superisor:Prof.Yin Abstract the ofdatawithout intrinsicinformationisa Reducingdimensionality losing inmachine anddata Reductionisan hotspot learning mining.Dimensionality tonon-·linearandlinear dataintoa approach mappinghigh—·dimensional low·dimensionalcandiscoverintrinsic low—dimensional space.It

文档评论(0)

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档