- 1、本文档共306页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
聚类分析概述 亲疏远程度的衡量指标 相似性:数据间相似程度的度量 距离: 数据间差异程度的度量.距离越近,越“亲密”,聚成一类;距离越远,越“疏远”,分别属于不同的类 定距型个体间的距离: 把每个个案数据看成是k维空间上的点,在点和点之间定义某种距离.一般适用于定距数据 欧氏距离(EUCLID) 平方欧氏距离(SEUCLID) 聚类分析概述 品质型个体间的距离 姓名 授课方式 上机时间 选某门课程 张三 1 1 1 李四 1 1 0 王五 0 0 1 聚类分析概述 品质型个体间的距离 简单匹配(simple matching)系数:适用二值变量。 个体j 个体i 1 0 1 a b 0 c d a为个体i与个体j在所有变量上同时取1的个数;d为同时取0的个数 特点:排除同时拥有或同时不拥有某特征的情况;取0和1地位等价,编码方案的变化不会引起系数的变化。 聚类分析概述 品质型个体间的距离 简单匹配(simple matching)系数:适用二值变量。 姓名 授课方式 上机时间 选某门课程 张三 1 1 1 李四 1 1 0 王五 0 0 1 (张三,李四):a=2 b=1 c=0 d=0 d(x,y)=1/(1+2)=1/3 (张三,王五):a=1 b=2 c=0 d=0 d(x,y)=2/(1+2)=2/3 张三距李四近 聚类分析概述 品质型个体间的距离 根据临床表现研究病人是否有类似的病 姓名 性别 发烧 咳嗽 检查1 检查2 检查3 检查4 张三 男 1 0 1 0 0 0 李四 女 1 0 1 0 1 0 王五 男 1 1 0 0 0 0 …….. 聚类分析概述 品质型个体间的距离 Jaccard系数:适用二值变量 个体j 个体i 1 0 1 a b 0 c d a为个体i与个体j在所有变量上同时取1的个数;d为同时取0的个数 特点:排除同时不拥有某特征的情况;取1的状态比取0更有意义(如:临床检验中的阳性特征);编码方案会引起系数的变化 聚类分析概述 品质型个体间的距离 Jaccard系数举例:根据临床表现研究病人是否有类似的病 姓名 性别 发烧 咳嗽 检查1 检查2 检查3 检查4 张三 男 1 0 1 0 0 0 李四 女 1 0 1 0 1 0 王五 男 1 1 0 0 0 0 …….. 结论:张三和李四最有可能得类似的病;李四和王五不太有可能 聚类分析概述 品质型个体间的距离 卡方距离:计数变量 姓名 选修课门数(期望频数) 专业课门数(期望频数) 得优门数(期望频数) 合计 张三 9(8.5) 6(6) 4(4.5) 19 李四 8(8.5) 6(
您可能关注的文档
最近下载
- 污水处理设备安装施工组织设计.docx
- 浙教版五年级上学期 第1课 身边的算法 课件.pptx VIP
- 汽车装配与调整 单元三 汽车装配工艺 汽车总装工艺文件的类型及作用.pptx
- 1.3太空探索+课件-2024--2025学年初中地理商务星球版(2024)七年级上册.pptx VIP
- 2024年河北省中考地理试题(含答案详解).pdf
- 金川集团股份有限公司职工帮扶互助基金管理办法实施细则.doc
- 反恐安全程序文件(定稿).docx VIP
- 中医特色专科建设计划及措施.docx VIP
- 电气一种票及安全措施、风险预控票、工作票、操作票编号原则A3.doc VIP
- 2024年江西外语外贸职业学院单招综合素质模拟试题及答案解析.docx
文档评论(0)