NTSYS软件进行聚类分析——UPGMA实例.pdf

NTSYS软件进行聚类分析——UPGMA实例.pdf

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

软件进行聚类分析实例

NTSYS——UPGMA

第一部分说明文档

Clusteranalysis聚合分析

NTSYSpc最常见的使用是对某些相似或相异矩阵进行各种聚类分析。以下是一个批处

理例子;首先,标准化数据矩阵,其次,计算各列之间的距离系数,第三,采用单链路聚类

方法,第四,计算表面值(超度量)矩阵和相关系数,第五,以散点图形式显示结果并同时

输出距离矩阵。

*stando=data.ntsr=sdata.nts*stando=data.ntsr=sdata.nts

*siminto=sdata.ntsr=dist.ntsc=dist*siminto=sdata.ntsr=dist.ntsc=dist

*sahno=dist.ntsr=tree.ntscm=single*sahno=dist.ntsr=tree.ntscm=single

*copho=tree.ntsr=coph.nts*copho=tree.ntsr=coph.nts

*mxcompx=coph.ntsy=dist.nts*mxcompx=coph.ntsy=dist.nts

*treeo=tree.nts*treeo=tree.nts

*outputo=dist.nts

第二部分实例解析

如果你的数据集包含量纲不一致的变量,则必须要先经过标准化处理,可以用STAND

组件完成。如下图指明了标准化窗口。Test.nts文件将被按行(意味着行为变量)标准化,并

输出标准化文件名为teststand.nts。如果你的变量量纲一致(如,基因序列)或者是定性数据

则不需要标准化处理。

输出结果如下(5个变量的简单统计)

下一步,相似或非相似矩阵数据集必须要在标准化后的数据集上构建,用来衡量各

OTUS(列)两两之间的相似/非相似程度。我们将遇到的问题将是如何选择参数,而且这

步非常重要。SIMGEND组件用于分析基因序列类型的数据,SIMQUAL组件用于分析定性

数据(如,有/无)。下面我们测试的数据将用SIMINT组件来计算距离矩阵。

结果如下图(显示输入和输出文件注解内容)

现在,我们将用SAHN模块来执行UPGMA聚合分析,输入参数如下,注意testTree.nts

为目录树式文件,只有先计算好OTUs之间的表象值(空间距离)方可以进行分析和输出

目录树。

一旦分析成功,树形图标将下NTSYSpc窗口下面显示。

结果仅显示有关输入的参数和信息,点击树形图标将显示如下窗口,如果你有超过

30OTUs,则仅能显示相对应的前30OTUs。右键点击图形打开图形选项窗口,你可以设置

每页显示的OTUs和在哪页显示。

当然,聚合分析好坏常常取决于聚合分析软件,为了验证聚合分析是否能有效的表示

你的距离矩阵,我们将用COPH组件把目录树式数据矩阵转换成空间距离(聚合分析软件产

生的隐式距离),COPH组件使用如下:

列表仅显示输入文件有关参数信息,下一步用MXCOMP模块来比较testCoph.nts和

testDist.nts文件,MXCOMP窗口如下:

图形显示如下,可以用图形选项来改变点的背景颜色。

另外,下图通常会列出输入参数和文件的信息:

我们仅感兴趣的部分为矩阵相关(就是所谓的表象相关系数)。概率值我们并不感兴趣,

因为它们是基于两个矩阵文件的独立性比较获得的(确切的说,testCoph.nts矩阵文件是基

于聚合分析文件testDist.nts矩阵文件产生的)。

文档评论(0)

151****6154 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档