- 1、本文档共67页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
nj进化树构建法的改进及其应用
摘要
摘要
分子系统发育分析是生物信息学中的重要研究领域,它的主要研究手段是从
一组同源的DNA或蛋白质序列出发,计算各个序列之间的进化距离,从而得到反
映物种进化关系的进化树。进化树通常是一棵二叉树:树的叶节点,代表了某个
具体序列;树的拓扑结构表现了各物种之间的亲缘关系远近;树的分枝长度刻画
了进化距离的大小。构建进化树的方法主要分为三类,即距离矩阵法、最简约方
法和极大似然法。
虽然距离矩阵法以结构简单、具有良好的理论基础等特点获得了广泛的应
用,但是这种方法在某些情况下会产生两个或多个拓扑结构不同的“等价”进化
树,也就是文献上所说的“tied
称NJ)是一种比较常见的距离矩阵法,也存在“tied
trees”问题,尽管其设
计目标是对同样的序列数据产生与输入顺序无关的唯一进化树。对于NJ法的
“tied
trees问题,大多数流行的分子系统发育分析软件并没有进行有效的处
理,通常仅根据算法实现方式的不同,只给出其中一种进化树的拓扑结构。·
本文详细分析了NJ法产生“tiedtrees”问题的原因,提出并实现了一种
改进邻接法(ImprovedNeighbor—Joining
NJ的一种扩展,而NJ可以看作INJ的一个特例。在迭代计算过程中,NJ总是任
意选取两个具有最小速率校正距离的序列或种群进行合并来生成新的分类单元,
而INJ则允许把多个(目前限制为3个)具有相同最小速率校正距离的序列或种
群进行合并,因此它所产生的进化树可能是多叉树。在NJ树不唯一时下,INJ
树通常是一棵唯一的多叉树;而在NJ树唯一时下,INJ树则与NJ树完全一致。
因此,INJ法较好地解决了NJ法的“tiedtrees”问题。
此外,本文还实现了一个包含完整INJ法和传统NJ法的分子发育分析软件
framework
叫ulti—Tree。该软件是一个基于Microsoft.Net2.0平台构建
的客户端应用,其中包括:多序列比对和编辑、距离矩阵计算、多种进化树构建
方法和显示模式。Multi—Tree软件系统采用了基于插件的程序结构,从指定位
置的一组程序集中动态获取系统的界面元素与业务逻辑,具有良好的扩展性与可
维护性,还可支持多语言的界面显示。
关键词进化树;二叉树;多叉树;邻接法;距离矩阵
Abstract
m
曼蔓曼曼曼曼曼曼曼曼詈曼曼皇. l —m l l曼!量曼曼!曼曼曼曼曼曼!曼!曼曼曼曼曼曼曼曼暑曼曼曼曼!曼!曼曼曼曼!曼!曼!曼曼曼
Abstract
is the
Molecular oneof most fieldsof
phylogeneticanalysis important
taskof
main whichiStoreconstructa treefroma
Bioinformatics,he phylogenetic
of DNAor the
grouphomologousproteinsequences,by evolutionary
calculating
distancesbetween showtheir
them,to evolutionary
treeisa
文档评论(0)