网站大量收购闲置独家精品文档,联系QQ:2885784924

用于树探索的python环境.docx

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
用于树探索的python环境 由Jaime Huerta-Cepas(通讯作者)JoaquínDopazo和ToniGabaldón评论 抽象 从基因聚类到系统发育,许多生物信息学分析产生了层次树作为其主要结果。 这些用来表示不同生物实体之间的关系,从而有助于它们的分析和解释。 提供了许多独立的程序,这些程序专注于树的可视化或对其执行特定的分析。 但是,此类应用很少适合需要更高自动化水平的大规模调查。 当前,许多全基因组分析都依赖于树状数据表示,因此,越来越需要可扩展的工具来大规模处理树状结构。 关键字:Python,尖峰神经元,模拟,集成和发射,教学,神经网络,计算神经科学,软件。 背景 在这里,我们介绍了树探索环境(ETE),这是一个python编程工具包,可帮助自动操作,分析和可视化层次树。 ETE库提供了广泛的树处理选项集以及分析系统树和聚类树的特定方法。 除其他功能外,ETE还允许对树分区进行独立分析,支持扩展的newick格式,提供集成的节点注释系统,并允许将树链接到外部数据,例如多个序列比对或数字数组。 此外,ETE还实现了许多内置分析工具,包括基于系统发育的正演预测和聚类验证技术。 最后,ETE的可编程树形绘图引擎可用于通过定制的特定于节点的可视化来自动化树的图形渲染。 结论 ETE提供了一套完整的方法来处理树数据结构,从而扩展了其他通用生物信息学工具包中的当前功能。 ETE是免费软件,可以从下载。树通常用于表示许多生物信息学分析的结果。特别地,这种类型的二元图非常适合描述各种生物实体之间的层次关系。一些常见的例子是分子序列的进化分析或基因和蛋白质根据其特性的聚类。除了以树的拓扑结构编码的信息外,还可以缩放分支长度以提供有关不同分区之间距离的信息。例如,在系统发育学中,树木被用来说明物种或分子序列之间的进化关系,将末端节点视为现存的操作分类单位(OTU),并将内部节点视为其对应的祖先。在这样的系统树中,分支长度通常与序列之间的进化距离成正比。其他应用,例如基因表达分析,使用层次聚类分析根据基因表达模式的相似性对基因或实验条件进行分组。同样,树木被许多蛋白质分类方法用来分析系统发育谱。因此,在生物信息学的许多领域中,对树数据结构的分析是常见的任务,并且需要分析和可视化工具。在这方面,确实存在许多有助于探索分层树的生物信息学程序。但是,它们中的大多数由独立的应用程序组成,这些应用程序专注于可视化,有时还专注于执行特定的测试。一些众所周知的例子是TreeView [1],这是一种广泛使用的检查系统发育树的程序。 Cluster Treeview [2],用于可视化微阵列聚类结果的应用程序; ATV [3],一个用于探索系统发育的Java程序,还提供了一些编辑选项。 MEGA [4],一种进化遗传学分析套件,包括一个内置的树查看器;以及其他许多最近的应用[5-8]。尽管所有这些程序对于管理单棵树都是非常有用的,但它们几乎无法自动化或适应特定需求。因此,当需要分析成百上千棵树时,由于需要更高水平的自动化,因此独立程序的使用受到限制。在这种情况下,编程工具箱代表了一个更适当的框架,因为它们提供了在较低级别处理数据的工具和方法。使用工具包,生物信息学家可以轻松地创建自己的分析管道,并对大量数据进行自定义任务编程[9]。确实存在几种涵盖广泛的编程语言和范围的通用生物信息学工具包,其中BioPerl [10]和BioPython [11]是开发最广泛的工具包。这些工具包与广泛的其他功能一起,允许与树数据结构进行一定程度的交互。但是,当前仅支持基本操作。另外,虽然PyCogent [12]和P4 /~pf/p4.html python工具包可以用来扩展此功能,但是它们主要集中在系统发育重建上。 R [13]是一个通用的统计框架,它确实包括几个用于对聚类树和系统树进行统计测试的软件包。但是,这些软件包专注于执行特定的分析,而不是提供树的处理和操纵功能。最后,与大量独立的树状查看器相比,编程工具包提供的图形呈现可能性很少(如果有的话)。在独立查看器和程序树渲染之间的中间替代方法是TreeDyn程序[14],它支持某些脚本选项,可用于创建完全注释的树图像。为了应对这些局限性,我们在这里介绍了“树探索环境”(ETE),这是一个用于分析,操纵或可视化任何类型的分层树的python编程工具包。它扩展了其他工具包中的功能,并允许进行高级别的自定义。 ETE的绘图功能虽然不如独立编辑器那么详尽,但它依赖于Python脚本语言,这使将高级树分析和树可视化结合到一个程序中成为可能。该工具包包括浏览和操作树形拓扑的方法,提供对新罕布什尔州扩展(NHX)格式的支持,并允许高级操作,例如节点注释,自动生根,剪切和粘贴分区,树级联,节点有哪些信誉好的足球投注网站以及与分支距离相关

文档评论(0)

173****9697 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档