- 1、本文档共6页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
软件进行聚类分析实例
NTSYS——UPGMA
第一部分说明文档
Clusteranalysis聚合分析
NTSYSpc最常见的使用是对某些相似或相异矩阵进行各种聚类分析。以下是一个批处
理例子;首先,标准化数据矩阵,其次,计算各列之间的距离系数,第三,采用单链路聚类
方法,第四,计算表面值(超度量)矩阵和相关系数,第五,以散点图形式显示结果并同时
输出距离矩阵。
*stando=data.ntsr=sdata.nts*stando=data.ntsr=sdata.nts
*siminto=sdata.ntsr=dist.ntsc=dist*siminto=sdata.ntsr=dist.ntsc=dist
*sahno=dist.ntsr=tree.ntscm=single*sahno=dist.ntsr=tree.ntscm=single
*copho=tree.ntsr=coph.nts*copho=tree.ntsr=coph.nts
*mxcompx=coph.ntsy=dist.nts*mxcompx=coph.ntsy=dist.nts
*treeo=tree.nts*treeo=tree.nts
*outputo=dist.nts
第二部分实例解析
如果你的数据集包含量纲不一致的变量,则必须要先经过标准化处理,可以用STAND
组件完成。如下图指明了标准化窗口。Test.nts文件将被按行(意味着行为变量)标准化,并
输出标准化文件名为teststand.nts。如果你的变量量纲一致(如,基因序列)或者是定性数据
则不需要标准化处理。
输出结果如下(5个变量的简单统计)
下一步,相似或非相似矩阵数据集必须要在标准化后的数据集上构建,用来衡量各
OTUS(列)两两之间的相似/非相似程度。我们将遇到的问题将是如何选择参数,而且这
步非常重要。SIMGEND组件用于分析基因序列类型的数据,SIMQUAL组件用于分析定性
数据(如,有/无)。下面我们测试的数据将用SIMINT组件来计算距离矩阵。
结果如下图(显示输入和输出文件注解内容)
现在,我们将用SAHN模块来执行UPGMA聚合分析,输入参数如下,注意testTree.nts
为目录树式文件,只有先计算好OTUs之间的表象值(空间距离)方可以进行分析和输出
目录树。
一旦分析成功,树形图标将下NTSYSpc窗口下面显示。
结果仅显示有关输入的参数和信息,点击树形图标将显示如下窗口,如果你有超过
30OTUs,则仅能显示相对应的前30OTUs。右键点击图形打开图形选项窗口,你可以设置
每页显示的OTUs和在哪页显示。
当然,聚合分析好坏常常取决于聚合分析软件,为了验证聚合分析是否能有效的表示
你的距离矩阵,我们将用COPH组件把目录树式数据矩阵转换成空间距离(聚合分析软件产
生的隐式距离),COPH组件使用如下:
列表仅显示输入文件有关参数信息,下一步用MXCOMP模块来比较testCoph.nts和
testDist.nts文件,MXCOMP窗口如下:
图形显示如下,可以用图形选项来改变点的背景颜色。
另外,下图通常会列出输入参数和文件的信息:
我们仅感兴趣的部分为矩阵相关(就是所谓的表象相关系数)。概率值我们并不感兴趣,
因为它们是基于两个矩阵文件的独立性比较获得的(确切的说,testCoph.nts矩阵文件是基
于聚合分析文件testDist.nts矩阵文件产生的)。
文档评论(0)