- 1、本文档共196页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第06章_聚类分析,聚类分析,聚类分析案例,spss聚类分析,聚类分析法,spss聚类分析步骤,spss聚类分析案例,模糊聚类分析,matlab聚类分析,聚类分析原理
* * * 例 6.9(续例 5.2) 对例5.2的数据进行快速聚类分析(27个省市区的编号如例6.5所示),按下列情况分析: (1)分为2类; (2)分为4类。 * 分为2类 data pjxf; input x1-x8; cards; …… ; proc fastclus data=pjxf out=a1 maxc=2 distance list; run; * * * * 分为4类 * * * * 用Lm距离进行快速聚类 上面我们介绍的聚类方法都是用欧氏距离。下面我们介绍用Lm距离进行快速聚类的方法。 设 ,则其Lm距离为 当 时,即是欧氏距离,当 时,为绝对距 离: * 用Lm距离进行快速聚类 我们先讨论L1的情况。 对于一元数据 ,要求一个数c,使得 可知,使上式达到最小的c是 的中位数 * 用Lm距离进行快速聚类 对于p元样品 。其中 的第k个分量的数据集是 ,设它的中位数是 ,则 称为 的中位向量,其中 满足 * 用Lm距离进行快速聚类 从而 * 用Lm距离进行快速聚类 讨论Lm最优化准则。对于一元数据 ,要求有一个数c,使得 称c为 的m中心。对于p元样品 , 其中 * 用Lm距离进行快速聚类 的第k个分量的数据集是 ,设它的m中心是 ,则 称为 的m中心向量,其中 满足 从而 * 用Lm距离进行快速聚类 2中心向量即均值向量,1中心向量即中位向量 在采用Lm距离进行快速聚类分析时,最终聚点应是每一类的m中心向量。在采用L1距离进行聚类分析时,最终聚点应是每一类的中位向量 用L1距离进行聚类分析时,有较强的稳健性,当有异常数据时,分类结果经常会更好些 采用不同的Lm距离,聚类分析的结果经常会是不同的 * 例 6.10(续例6.7) 利用绝对距离对例6.7的数据进行快速聚类。 * * * * 例 6.11(续例6.8) 利用绝对距离对例6.8的数据进行快速聚类。 (1)分为3类; (2)分为4类。 * 例 6.11(续例6.8) 利用绝对距离对例6.8的数据进行快速聚类。 (1)分为3类; (2)分为4类。 * * * * * * 快速聚类法 选择聚点 最终分类 合理 初始分类 分类是否合理 修改分类 不合理 * 快速聚类法的步骤 1 选择聚点 聚点(种子)是一批有代表性的样品,它的选择 决定了初始分类,对最终分类有较大影响。 在进行快速聚类法前,要根据研究问题的要求及 了解程度先定下分类数k,这样就可以在每一类中选 择一个有代表性的样品作为聚点(初始聚点)。 * 快速聚类法的步骤 1 选择聚点 选择聚点有下列方法: 1)经验选择。如果对研究对象比较了解,根据以 往的经验定下k个样品作为聚点。 2)将n个样品人为地(或随机地)分成k类,以 每类的重心作为聚点。 * 快速聚类法的步骤 1 选择聚点 3)最小最大原则。设要将n个样品分成k类,先 选择所有样品中距离最远的两个样品 为前两个聚 点,即选择 和 ,使 然后,选择第3个聚点 ,使得 与前两个聚点的距 离最小者等于所有其余的与 的较小距离中最大 的,用公式表示为 * 快速聚类法的步骤 然后按相同的原则选取 ,依次下去,直至选定k个 聚点 。 若已选了l个聚点(lk),则第l+1个聚点选取的原 则为 * 快速聚类法的步骤 注:在SAS系统proc fastclus过程中,分类数k是事先 给定的。在给定k以后, proc fastclus过程会按上述方 法算出初始聚点的。 * 快速聚类法的计算步骤 先假设聚类中采用的距离是欧式距离,即 1)设k个初始聚点的集合是 用下列原则实现初始分类。记 这样,将样品分成不相交的k类。以上初始分类的原 则是每个样品以最靠近的初始聚点归类。 * 快速聚类法的计算步骤 依照以上计
文档评论(0)