应用多元统计分析课后习题答案详解北大高惠璇(第六章习题解答)(完整版).ppt

应用多元统计分析课后习题答案详解北大高惠璇(第六章习题解答)(完整版).ppt

  1. 1、本文档共38页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 第六章 聚类分析 必威体育精装版文档 * 第六章 聚类分析 必威体育精装版文档 必威体育精装版文档 必威体育精装版文档 必威体育精装版文档 必威体育精装版文档 必威体育精装版文档 必威体育精装版文档 必威体育精装版文档 应用多元统计分析 第六章部分习题解答 必威体育精装版文档 * * 第六章 聚类分析 6-1 证明下列结论: (1) 两个距离的和所组成的函数仍是距离; (2) 一个正常数乘上一个距离所组成的函数仍是距离; (3)设d为一个距离,c0为常数,则 仍是一个距离; (4) 两个距离的乘积所组成的函数不一定是距离; 必威体育精装版文档 * 第六章 聚类分析 ① ② ③ (2) 设d是距离,a 0为正常数.令d*=ad,显然有 ① ② 必威体育精装版文档 * 第六章 聚类分析 ③ 故d*=ad是一个距离. (3) 设d为一个距离,c0为常数,显然有 ② ① 必威体育精装版文档 * 第六章 聚类分析 故d*是一个距离. ③ 必威体育精装版文档 * 第六章 聚类分析 必威体育精装版文档 * 第六章 聚类分析 6-2 试证明二值变量的相关系数为(6.2.2)式,夹角余弦为(6.2.3)式. 证明:设变量Xi和Xj是二值变量,它们的n次观测值记为xti, xtj (t=1,…,n). xti, xtj 的值或为0,或为1.由二值变量的列联表(表6.5)可知:变量Xi取值1的观测次数为a+b,取值0的观测次数为c+d;变量Xi和Xj取值均为1的观测次数为a,取值均为0的观测次数为d 等等。利用两定量变量相关系数的公式: 必威体育精装版文档 * 第六章 聚类分析 必威体育精装版文档 * 第六章 聚类分析 故二值变量的相关系数为: (6.2.2) 必威体育精装版文档 * 第六章 聚类分析 利用两定量变量夹角余弦的公式: 其中 故有 必威体育精装版文档 * 第六章 聚类分析 6-3 下面是5个样品两两间的距离阵 试用最长距离法、类平均法作系统聚类,并画出谱系聚类图. 解:用最长距离法: ① 合并{X(1),X(4)}=CL4, 并类距离 D1=1. 必威体育精装版文档 * 第六章 聚类分析 ② 合并{X(2),X(5)}=CL3,并类距离 D2=3. ③ 合并{CL3,CL4}=CL2,并类距离 D3=8. ④ 所有样品合并为一类CL1,并类距离 D4=10. 必威体育精装版文档 * 第六章 聚类分析 最长距离法的谱系聚类图如下: 必威体育精装版文档 * 第六章 聚类分析 ① 合并{X(1),X(4)}=CL4,并类距离 D1=1. 用类平均法: 必威体育精装版文档 * 第六章 聚类分析 ② 合并{X(2),X(5)}=CL3,并类距离 D2=3. ③ 合并{CL3,CL4}=CL2,并类距离 D3=(165/4)1/2. ④ 所有样品合并为一类CL1,并类距离 D4=(121/2)1/2. 必威体育精装版文档 * 第六章 聚类分析 类平均法的谱系聚类图如下: 必威体育精装版文档 * 第六章 聚类分析 6-4 利用距离平方的递推公式 来证明当γ=0,αp≥0,αq≥0,αp+αq+β≥1时,系统聚类中的类平均法、可变类平均法、可变法、Ward法的单调性. 证明:设第L次合并Gp和Gq为新类Gr后,并类距离DL =Dpq,且必有Dpq2≤Dij2 . 新类Gr与其它类Gk的距离平方的递推公式 ,当γ=0,αp≥0,αq≥0, αp+αq+ β ≥1 时 这表明新的距离矩阵中类间的距离均≥ Dpq = DL ,故有DL+1 ≥ DL ,即相应的聚类法有单调性. 必威体育精装版文档 * 第六章 聚类分析 对于类平均法,因 故类平均法具有单调性。 对于可变类平均法,因 故可变类平均法具有单调性。 必威体育精装版文档 * 第六章 聚类分析 对于可变法,因 故可变法具有单调性。 对于离差平方和法,因 故离差平方和法具有单调性。 必威体育精装版文档 * 第六章 聚类分析 6-5 试从定义直接证明最长和最短距离法的单调性. 证明:先考虑最短距离法: 设第L步从类间距离矩阵 出发,假设 故合并Gp和Gq为一新类Gr,这时第L步的并类距离: 且新类Gr与其它类Gk的距离由递推公式可知 设第L+1步从类间距离矩阵 出发, 必威体育精装版文档 * 第六章 聚类分析 故第L+1步的并类距离: 即最短距离法具有单调性. 类似地,可以证明最长距离法也具有单调性. 必威体育精装版文档 * 第六章 聚类分析 6-6 设A,B,C为平面上三个点,它们之间的距离为 将三个点看成三个二维样品,试用此例说明中间距离法和重心法不具有单调性. 解:按中间距离法,取β=-1/4,将B和C合并为一类后,并类距离D1=1,而A与新类Gr={B,C}的类间平方距离为 最

文档评论(0)

liuxiaoyu92 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档