- 1、本文档共153页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
**********第十二章聚类分析求解过程第6步令Ip=Ip+1=2,Nc=Nc+1=2,按最小距离原则对样本重新归类:?1={X4,X5,X6,X7,X8},n1=5?2={X1,X2,X3},n2=3因nj?n(j=1,2),故无合并。返回第十二章聚类分析求解过程第7步计算聚类中心计算内类平均距离计算总的类内平均距离返回第十二章聚类分析求解过程第8步计算类间距离得D12=4.72,由D12?D,类不能合并因Ip=2I=4,令Ip=Ip+1=3,判断是否修改参数。由上面结果可知,已获得所要求类别数目,类间距离大于类内距离,每类样本数都有样本总数的足够大的百分比,因此不改变参数。返回第十二章聚类分析求解过程第9步计算?1={X4,X5,X6,X7,X8}和?2={X1,X2,X3}的标准差矢量所以?1max=0.75,?2max=0.82因?jmax?s,故分裂条件不满足因D12=4.72?D=4,故合并条件不满足令Ip=Ip+1=4,计算无变化,停止。返回第十二章聚类分析近邻函数法该方法特别适合于类的样本分布是条状或线状的情况。算法细节可查阅有关资料自学。返回第十二章聚类分析条状或线状分布样本示意图返回第十二章聚类分析自组织特征映射该方法可将任意维数的输入样本映射为一维或二维分布,并且可以较好地保持原样本分布的拓扑结构。演化示意图1,演化示意图2。算法细节可查阅有关资料自学。返回第十二章聚类分析自组织特征映射演化示意图1返回第十二章聚类分析自组织特征映射演化示意图2返回第十二章聚类分析第六节动态聚类第十二章聚类分析动态聚类法系统聚类法是一种比较成功的聚类方法。然而当样本点数量十分庞大时,则是一件非常繁重的工作,且聚类的计算速度也比较慢。比如在市场抽样调查中,有4万人就其对衣着的偏好作了回答,希望能迅速将他们分为几类。这时,采用系统聚类法就很困难,而动态聚类法就会显得方便,适用。动态聚类使用于大型数据。第十二章聚类分析动态聚类法基本思想:选取若干个样品作为凝聚点,计算每个样品和凝聚点的距离,进行初始分类,然后根据初始分类计算其重心,再进行第二次分类,一直到所有样品不再调整为止。第十二章聚类分析选择凝聚点分类修改分类分类是否合理分类结束YesNo第十二章聚类分析用一个简单的例子来说明动态聚类法的工作过程。例如我们要把图中的点分成两类。快速聚类的步骤:1、随机选取两个点和作为凝聚点。2、对于任何点,分别计算3、若,则将划为第一类,否则划给第二类。于是得图(b)的两个类。4、分别计算两个类的重心,则得和,以其为新的凝聚点,对空间中的点进行重新分类,得到新分类。第十二章聚类分析(b)任取两个凝聚点(c)第一次分类(d)求各类中心(a)空间的群点第十二章聚类分析(e)第二次分类第十二章聚类分析动态聚类法优点:计算量小,方法简便,可以根据经验,先作主观分类。缺点:结果受选择凝聚点好坏的影响,分类结果不稳定。第十二章聚类分析选择凝聚点和确定初始分类凝聚点就是一批有代表性的点,是欲形成类的中心。凝聚点的选择直接决定初始分类,对分类结果也有很大的影响,由于凝聚点的不同选择,其最终分类结果也将出现不同。故选择时要慎重.通常选择凝聚点的方法有:(1)人为选择,当人们对所欲分类的问题有一定了解时,根据经验,预先确定分类个数和初始分类,并从每一类中选择一个有代表性的样品作为凝聚点。(2)重心法将数据人为地分为A类,计算每一类的重心,将重心作为凝聚点。第十二章聚类分析(3)密度法以某个正数d为半径,以每个样品为球心,落在这个球内的样品数(不包括作为球心的样品)称为这个样品的密度。计算所有样品点的密度后,首先选择密度最大的样品为第一凝聚点。然后选出密度次大的样品点,若它与第一个凝聚点的距离大于2d,则将其作为第二个凝聚点;否则舍去这点。这样,按密度由大到小依
文档评论(0)