一种基于层次距离计算的聚类算法_彭京论述.pdf

一种基于层次距离计算的聚类算法_彭京论述.pdf

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第 30 卷  第 5 期 计   算   机   学   报 Vo l. 30 N o. 5 2007 年 5 月 CH IN ESE JOU RNA L OF COM PUTE RS M ay 2007   一种基于层次距离计算的聚类算法 1), 2), 3) 2) 3) 3) 2) 彭  京  唐常杰  程温泉  石葆梅  乔少杰 1)(北京大学信息科学技术学院  北京  100871) 2)(四川大学计算机学院 成都  610065) 3)(成都市公安局科技处 成都  610017) 摘 要  针对广泛存在的层次编码型数据类型 , 提出了层 次距离的新概念 , 证明了 相关的数学 性质 , 并在此基础 上 提出并实??了新的基 于层 次 距离 计算 的 聚类 算 法 HDCA(Hierarchy Distance Computing based clustering A lg o- rithm). 新方法克服了传统聚类算法标称型计算的缺陷 , 提高了聚类精度. 针对聚 类算法的中心点问题 , 提出了相 应 的层次编码型数据的快速处理算法 , 并从理论上 证明了算法的 正确性. 实验表 明 , 对比朴 素处理算 法 , HDCA 的 性 能明显提高. 新算法已经应用到警用流动人口分 析当中 , 取得了良好效果. 关键词  聚类 ;层次距离 ;层次编码变量 ;k-中心 ;数据挖掘 中图法分类号 T P 311 A Hierarchy Distance Computing Based Clustering Algorithm PENG Jing1), 2), 3)  TANG Chang-Jie2)  CH ENG Wen-Quan3)  SH I Bao-Mei3)  Q IAO Shao-Jie2) 1)(S chool o f E lectronics Eng ineerin g and Comp uter S cience , Peking Un iversity , Beijing  100871) 2)(S chool o f Comp uter S cience , S ich uan Un iversity , Cheng du  610065) 3)(Dep artment o f S cience and Technolog y , Chen gd u Municipa l Public S ecurity B ureau , Cheng du  610017) Abstract   To deal w ith the hierarchy coding data structure w idely e xisted in applicatio n , this pa- per proposes a new conception of hierarchy distance and pro ves its m athematical pro perties. It al- so proposes and implem ents a new clustering algo rithm-H DCA (H ierarchy Distance Co mputing based clustering Alg orithm) based

文档评论(0)

1112111 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档