phylip使用说明pylip使用说明.doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
phylip使用说明pylip使用说明

系统发育树的常用算法 1.UPGMA (PHYLIP: neighbour)除权配对法 2.Neighbour Joining (PHYLIP: neighbour)临近距离法 3.Fitch-Margoliash (PHYLIP: fitch) 4.Maximum Parsimony 最大简约性法 DNA sequences (PHYLIP: dnapars) Protein sequences (PHYLIP: protpars) 5.Maximum Likelihood 最大可能性法 DNA sequences (PHYLIP: fastDNAML, Molphy: nucML) Protein sequences (Molphy: protML) 构建进化树的完整步骤 ⑴ 对所分析的多序列目标进行排列(do alignment)。 ⑵ 构建一个进化树(To reconstrut phyligenetic tree)。 构建进化树的算法主要分为两类:独立元素法(discrete character methods)和距离依靠法(distance methods)。 独立元素法:指进化树的拓扑形状是由序列上的每个碱基/氨基酸的状态决定的(例如:一个序列上可能包含很多的酶切位点,而每个酶切位点的存在与否是由几个碱基的状态决定的,也就是说一个序列碱基的状态决定着它的酶切位点状态,当多个序列进行进化树分析时,进化树的拓扑形状也就由这些碱基的状态决定了)。 独立元素法包括最大简约性法(Maximum Parsimony methods)和最大可能性法(Maximum Likelihood methods); 距离依靠法是指进化树的拓扑形状由两两序列的进化距离决定的。进化树枝条的长度代表着进化距离。 距离依靠法包括除权配对法(UPGMAM)和邻位相连法(Neighbor-joining)。 一般来说, 最大简约性法 适用于符合以下条件的多序列: i 所要比较的序列的碱基差别小, ii 对于序列上的每一个碱基有近似相等的变异率, iii 没有过多的颠换/转换的倾向, iv 所检验的序列的碱基数目较多(大于几千个碱基); 最大可能性法 分析序列则不需以上的诸多条件,但是此种方法计算极其耗时。如果分析的序列较多,有可能要花上几天的时间才能计算完毕。 UPGMAM(Unweighted pair group method with arithmetic mean) 假设在进化过程中所有核苷酸/氨基酸都有相同的变异率,也就是存在着一个分子钟。这种算法得到的进化树相对来说不是很准确,现在已经很少使用。 邻位相连法 是一个经常被使用的算法,它构建的进化树相对准确,而且计算快捷。其缺点是序列上的所有位点都被同等对待,而且,所分析的序列的进化距离不能太大。 另外,需要特别指出的是对于一些特定多序列对象来说可能没有任何一个现存算法非常适合它。最好是我们来发展一个更好的算法来解决它。但无疑这是非常难的。我想如果有人能建立这样一个算法的话,那他(她)完全可以在Proc.Natl.Acad.Sci.USA.上发一篇高质量的文章。 ⑶ 对进化树进行评估。 主要采用Bootstraping法。进化树的构建是一个统计学问题。我们所构建出来的进化树只是对真实的进化关系的评估或者模拟。如果我们采用了一个适当的方法,那么所构建的进化树就会接近真实的“进化树”。模拟的进化树需要一种数学方法来对其进行评估。不同的算法有不同的适用目标。 所谓Bootstraping法就是从整个序列的碱基(氨基酸)中任意选取一半,剩下的一半序列随机补齐组成一个新的序列。这样,一个序列就可以变成了许多序列。一个多序列组也就可以变成许多个多序列组。根据某种算法(最大简约性法、最大可能性法、除权配对法或邻位相连法)每个多序列组都可以生成一个进化树。将生成的许多进化树进行比较,按照多数规则(majority-rule)我们就会得到一个最“逼真”的进化树。Jackknife则是另外一种随机选取序列的方法。它与Bootstrap法的区别是不将剩下的一半序列补齐,只生成一个缩短了一半的新序列。Permute是另外一种取样方法,其目的与Bootstrap和Jackknife法不同,这里不再介绍。 PHYLIP软件简介 PHYLIP其实是多个软件的压缩包,主要包括五个方面的功能软件:  = 1 \* roman i,DNA和蛋白质序列数据的分析软件。  = 2 \* roman ii,序列数据转变成距离数据后,对距离数据分析的软件。  = 3 \* roman iii,对基因频率和连续的元素分析的软件。

您可能关注的文档

文档评论(0)

zyongwxiaj8 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档