分子系统发生理论和实践要点.doc

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
分子系统发生学:理论和实践 文摘:分子进化是重要的解决各种生物物种或基因之间的关系等问题的起源,发展和物种的数目变化和迁移模式。测序技术的进步了系统发育分析到一个新的高度。生物进化已经渗透到几乎每一个分支,过多的分支以及庞杂的分析软件包让生物学家犯了愁。在这里,我们审查系统进化分析的主要方法,包括直系、距离、可能性和贝叶斯方法。我们讨论他们的优势和劣势,为其使用提供指导。 出现DNA测序技术之前,系统发育树几乎只用于描述在分类学和物种分类之间的关系。今天,生物学的分子测序用于几乎所有进化分支。除了代表的关系,基因在物种生命之树上的发展史是用来描述paralogues之间的关系在一个基因家族,历史的人口,病原体的进化- ary和流行病学动态,体细胞的系谱关系在不同的点子和癌症发展和语言的进化。最近,分子系统发生学基因组compari——子基因成为一个不可或缺的工具。在这种情况下,它使用:将宏基因组序列,识别基因,监管元素和新测序的基因组的非编码rna;解释现代和古代个人基因组;重建祖先基因组。 在其他应用程序中,发展史本身可能不是直接利益但不过必须占在分析。这种“树思维”改变了许多生物学的分支。在群体遗传学,开发创新中合并理论和广泛的可用性的多个个体的基因序列相同物种的发展促使genealogy-based推理方法,具有转速- olutionized现代计算人口麝猫- ics。这里,基因树描述序列样本的家谱是高度不确定的;他们不是直接兴趣但是包含有价值的公司——美信模型中的参数。树想也结下了深厚的人口遗传学和合成 系统发生学,形成统计的新兴领域。在物种树methods2基因树的单个位点可能不是直接兴趣和可能与物种树相冲突。在未被注意的平均基因树下多品种联合模型,这些方法推断物种树尽管基因树的不确定性。在比较分析,推理之间的关联特征(例如,睾丸大小和性滥交)使用现代物种的观测特征应该考虑物种发展史避免曲解历史事件的因果关系。推理的自适应蛋白质进化发展史是用来跟踪同义和nonsynonymous substitu沿着树枝,不确定加速氨基酸变化的情况下,即使发展史不直接利益。 一个种系发生是系谱历史分支长河中不知道的参数。例如,左图的种系发生在t0~t1时间点内的两个特殊事件。分支的长度(b0,b1,b2,b3)展示的是在整个进化分支中每两个位点间预期的替换单位和测量值总和的类型。 如果替换数据长时间保持恒定,我们称之为分子保留时钟。这棵树将会有一个超度量的根,意思是从树尖到树根的距离是相等的。在树根上的物种代表年龄是祖先的节点因此包含长长分支的参数。树根和分子钟傲慢的程序分子钟根。对于亲缘关系较近的物种来说,假设这个时钟不傲慢。分子生物学家分析,不能出现这种结果。如果分支树上的每一个分支允许有一个独立的进化数据,通常用的模型和方法是不能识别根上的特定位点的,所以只有树上的非根除能被识别推断出来。一个没有根的S物种的树应该有2S--3的距离。据分析通常用的策略是包括物种以外的树根,众所周知的亲缘关系远的物种。尽管推断树对于所有的物种都是无根的,但在整个分支的特定位点仍然被相信有根的存在来领导外源物种所以物种内是有根的。这个策略被称为组织外的根。 一个系统进化树包括节点和分支,每一个分支 代表一个遗传宗谱的存在,每一个节点代表一个新的遗传宗谱的出现。如果这个树代表一群物种的关系那么这个节点代表嗲表五中的形成,在别的context中关系可能就不是这样了。比如在一个人类的基因序列树中,一个节点就会代表一个个体的出生,然而在一个paralogous基因树中,一个节点就会代表一个重复基因的出现。系统进化数不是直接发现的,它是由基因序列或是其他数据推出来的。本次系统进化树的重建时基于距离和character俩方面。在距离矩阵的方法中,没对序列的距离被估计,之后的结果用于树的重建。 基于性状的方法包括maximum parsimony, maximum likelihood and Bayesian inference 方法。这些方法同时比对所有的序列,如果有一个位点相同就给这个树加一分。这个树的分数是 maximum parsi-mony(最大值过度吝啬)方法里边的最小的改变值,是 maximum likelihood 方法里的可能值的log值,是Bayesian inference方法里的posterior probability值。在理论上,用分数最高的树和所有可能的树做对比, 而实际上,因为有很多可能的树,比如彻底的计算不实一个好的计算方法除非是一个晓得数据,所以我们用了算法来得到启发式的树,经常用一种快速的算法来得到一个starting tree的树,之后 再用次数来重新排列以计算次数的分数。一个启发式的树不能保证是一个最好的树在一定

文档评论(0)

光光文挡 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档