聚类分析的案例分析教程.pptVIP

  1. 1、本文档共77页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
聚类分析的案例分析教程 load fisheriris subplot(2,3,1) plot(meas(1:50,1),meas(1:50,2),*,meas(51:100,1), ..., meas(51:100,2),g*,meas(101:150,1),meas(101:150,2), ..., ro), title(x1-x2) subplot(2,3,2) plot(meas(1:50,1),meas(1:50,3),*,meas(51:100,1), ..., meas(51:100,3),g*,meas(101:150,1),meas(101:150,3), ..., ro), title(x1-x3) subplot(2,3,3) plot(meas(1:50,1),meas(1:50,4),*,meas(51:100,1), ..., meas(51:100,4),g*,meas(101:150,1),meas(101:150,4), ..., ro),title(x1-x4) subplot(2,3,4) plot(meas(1:50,2),meas(1:50,3),*,meas(51:100,2), ..., meas(51:100,3),g*,meas(101:150,2),meas(101:150,3),ro), ..., title(x2-x3) subplot(2,3,5) plot(meas(1:50,2),meas(1:50,4),*,meas(51:100,2), ..., meas(51:100,4),g*,meas(101:150,2),meas(101:150,4),ro), ..., title(x2-x4) subplot(2,3,6) plot(meas(1:50,3),meas(1:50,4),*,meas(51:100,3), ..., meas(51:100,4),g*,meas(101:150,3),meas(101:150,4),ro), ..., title(x3-x4) 结果显示第一类里只有两个样品,说明聚类效果不理想, 为了提高聚类效果的优良性,我们将运用K均值聚类和模糊 C均值聚类对其进行再讨论. 图6.6 Iris 数据的散点图(两个指标) 同理可作两两指标经聚类分类后的数据散点图。 从图形6.6也可看出?聚类效果不理想。 2.2 K-均值聚类 谱系聚类法是先将每个样品看成一类,通过比较距离的大小逐步扩充类,因此,对于给定的数据,谱系聚类一定能够将样品合并为一类,分类的结果唯一,但是谱系聚类有一个缺点,样品一旦被分到某一类中就不能改变,且当样本容量较大时,计算量也相应地变大. 克服此缺点的一个方法就是K均值聚类法,又称快速聚类法或动态聚类法. 在运用K均值聚类法之前,要根据实际问题先确定分类数k, 在每一类中选择有代表性的样品,这样的样品称为聚点. 选择聚点的方法通常有最小最大原则. 若将 个样品分成k类,则先选择所有样品中距离 为前两个聚点,即选择 ,使得 最远的两个样品 然后选择第3个聚点 ,使得 与前两个聚点 的较小距离中 的距离最小者等于所有其余的与 最大的,即 然后按相同的原则选取 ,重复前面的步骤,直至确定 k个聚点 K均值聚类的步骤 样品之间的距离采用欧氏距离. 设第k个初始聚点的集合是: 记 于是,将样品分成不相交的k类,得到一个初始分类 (2) 从 出发,计算新的聚点集合 ,计算 其中 是类 中的样品数,得到一个新的集合 从 开始再进行分类,将样品作新的分类,记 得到一个新的分类 依次重复计算下去. d3=pdist(x, minkowski,3); %计算明氏距离,d3为1行10列 的行向量 d4=pdist(x,chebychev)  %计算切氏距离. d5=pdist(x,seuclidean)  %计算方差加权距离. d6=pdist(x,mahalanobis) %计算马氏距离 d2=pdist(x,cityblock); %计算绝对距离 D2=squareform(d2) D2 = 1.0e+004 * 0 0.5265 1.3881 1.6009 1.5519 0.5265 0 1.5600 1.8090 1.7281 1.3881 1.5600 0 0.2490 0.1921 1.6009 1.8090 0.2490 0 0.2078 1.5519 1.7281 0.1921 0.2078

文档评论(0)

mwk365 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档