一种基于高维空间映射的k调和均值聚类方法.pdfVIP

一种基于高维空间映射的k调和均值聚类方法.pdf

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种基于高维空间映射的k调和均值聚类方法

(19)中华人民共和国国家知识产权局 *CN102426631A* (12)发明专利申请 (10)申请公布号 CN 102426631 A (43)申请公布日 2012.04.25 (21)申请号 201110341012.7 (22)申请日 2011.11.01 (71)申请人 南京理工大学常熟研究院有限公司 地址 215513 江苏省常熟市经济技术开发区 科创园研究院路5 号 (72)发明人 王建宇 康其桔 马鹏飞 孙丽娟 陆源 何新 王凯 田乃鲁 (51)Int.Cl. G06F 19/00 (2011.01) 权利要求书 1 页 说明书 3 页 附图 1 页 (54)发明名称 一种基于高维空间映射的K 调和均值聚类方 法 (57)摘要 本发明公开一种基于高维空间映射的K 调 和均值聚类方法,本方法假设样本数据已具有空 间向量形式,将该空间向量数据映射至更高维的 空间后引入K 调和均值进行数据聚类,具体步骤 如下:(1)数据处理;(2)选择数据的初始化聚类 中心;(3)将距离测度映射至高维空间;(4)将映 射后的距离测度带入计算数据样本的调和距离; (5) 以该调和距离为距离测度进行K 均值聚类; (6)结果输出;本发明可以有效改善现有K 均值算 法对初值的敏感性,并大大改善了因数据混叠而 引起的聚类误差。 A 1 3 6 6 2 4 2 0 1 N C CN 102426631 A 权 利 要 求 书 CN 102426639 A 1/1 页 1. 一种基于高维空间映射的K 调和均值聚类方法,其特征在于包括如下步骤: (1)将原始数据处理为空间向量形式; (2)选择数据的初始化聚类中心; (3)将距离测度映射至高维空间; (4)将映射后的距离测度带入计算样本点的调和距离; (5) 以该调和距离为距离测度进行K 均值聚类; (6)结果输出。 2. 根据权利要求1 所述的基于高维空间映射的K 调和均值聚类方法,其特征在于:所 述步骤 (3)中的距离测度为夹角余弦值。 3. 根据权利要求2 所述的基于高维空间映射的K 调和均值聚类方法,其特征在于:所 述步骤 (3)中采用Mercer 核函数将夹角余弦值映射到高维空间。 2 CN 102426631 A 说 明 书 CN 102426639 A 1/3 页 一种基于高维空间映射的K调和均值聚类方法 技术领域 [0001] 本发明涉及计算科学和智能信息处理领域,尤其是对数据集进行聚类的技术,具 体地说是一种基于高维空间映射的K 调和均值聚类方法。 背景技术 [0002] 聚类分析作为一种数据预处理方法,是进一步分析和处理数据的基础,聚类分析 在处理大规模数据中成为不可或缺的重要工具。目前,最常用的数据聚类方法是K 均值聚 类方法,实验证明,该方法虽能在一定程度上解决智能信息处理过程中的聚类需求,但是该 方法对初始化聚类中心的随机性非常敏感,而且无法解决实际工程应用中的数据混叠问 题,所以该方法已经不能适用于当前大规模复杂数据聚类的需求。因此迫切需求一种对初 始化聚簇中心不甚敏感且能解决数据混叠问题的聚类方法。 发明内容 [0003] 本发明的目的在于提供了一种基于高维空间映射的K 调和均值聚类方法,该方法 能够使大规模复杂数据聚类结果稳

您可能关注的文档

文档评论(0)

zhuwo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档