基于特征的系统发生分析.ppt

  1. 1、本文档共54页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
本文观看结束!!! 严格一致树 (strict consensus tree):只要有一棵简约树与其他不同,对所有不一致的分支点都进行相同的处理。 过半截定一致 (50% majority-rule consensus) :只要有至少一半的树符合条件,这个内部节点在一致树中就可以表示成二叉节点,而少于一半的树符合条件的内部节点表示为多叉节点。 不一致性阈值是一个参数,可以取0 ~100%的任意值。 由一个数据集推断出的3棵树 7 7 1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6 7 1 2 3 4 5 6 7 过半截定一致原则 1 2 3 4 5 6 7 严格一致原则 5.5 树的置信度 所有的系统发生树都是关于组成数据集的序列的进化历史的假设。 系统发生树的可靠性? 问题: (1)整棵树和它的组成部分(分支)的置信度是多少? (2)这样得到正确的树的可能性比随机选出一棵是正确的树的可能性大多少? 解决方法: 自举检验——解决问题(1) 参数检验——解决问题(2) 5.5.1 自举检验 (bootstrap test) 自举检验是一种重采样技术,能粗略地量化这些置信度水平。 自举检验的基本方法是: (1)从原数据集中抽取(同时替换)部分数据组成新的数据集。 (2)用这个新的数据集 推断 系统发生树。 重复上述过程,产生成百上千的重采样数据集,并同时生成对应的自举树,进而检验自举树对最终系统发生树各个分支的支持率。 在各个自举树中都有出现或大量出现的那些部分将具有较高的置信度。产生相同分组的自举树的数目常常标注在系统发生树相应节点的旁边,表示树中每个部分的相对置信度。 系统发生树的自举检验 序列 Ⅳ 位置 Ⅰ Ⅱ Ⅲ Ⅴ 推断树 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ 自举树1 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ 自举树2 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ 自举树3 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ (a) (b) 自举树 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ (c) 为3个重采样数据集的一致树 75 67 G G G G G G G A A A G G G A G G G A A A G G G T A A A A A T G A A C A A A G G T G T T C A A A A A T 1 2 2 4 5 5 5 7 7 10 G G G G G G A T T T G G G A T T A T T T A A A T G G A C C C T T T C T T G T T T T T T C T T A T T T 3 3 3 4 6 6 7 8 8 8 G G G G G G G C C C G G G G G G T C C C G G A A A A G A A A G G T A A A T A A A G G T A A A T C C C 1 1 3 5 5 5 6 9 9 9 G G G G G G A T C A G G G A G T A T C A G G A T A G A C A T G A T C A T G T A T G T T C A T A T C T 1 2 3 4 5 6 7 8 9 10 5.5.2 参数检验 是否一棵有 10,000 个替换的树比另一棵有10,001个替换的树更有可能描述序列间真实进化关系? 比起先前提出的另一棵描述物种间进化关系的树,最简约树是真实树的概率会大多少? H. Kishino 和 M. Hasegawa 假设比对中的各个信息位点彼此独立而且等价,并用两棵树的最小替换数之差 D作为检验统计量。分别考虑每一个信息位点,按下式计算反映 D 变化程度的 V 值: 其中 n 是信息位点的数目,Di 为两棵树中各个信息位点替换数的差值。n–1个自由度的 t 检验可以用来检验空假设,即两棵树的替换数相等的情况: 5.6 各种系统发生分析方法的比较 无论是基于距离的系统发生树重建方法,还是基于特征的系统发生树重建方法,都不能保证一定能够得到一棵描述比对序列进化历史的真实的树。 一般的,对于某个数据集,如果用一种方法能推断出正确的系统发生关系,那么用其他流行的方法也能得到好的结果。但是,如果模拟数据集中序列变化很大,或不同的分支变化速率不同,则没有一种方法十分可靠。 总规则:如果用截然不同的距离矩阵法和简约法分析一个数据集能够产生相似的系统发生树,则这棵树相当可靠。 5.7 分子系统发生分析 5.7.1 生命之树 序列分析提供了关于进化关系的新信息,其中最具影响力的是我们对于生命分化本质的理解。 过去30年中涌现了无数用序列分析解开进化关系之谜的有趣而重要的例子。这样的研究往往对医学、农业和自然保护有重要的意义

文档评论(0)

xx88606 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档