PyNAST一种用于比对序列与模板比对物的灵活工具.PDF

PyNAST一种用于比对序列与模板比对物的灵活工具.PDF

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
PyNAST一种用于比对序列与模板比对物的灵活工具.PDF

PyNAST:一种用于比对序列与模板比对物的灵活工具 英文题目:PyNAST: a flexible tool for aligning sequences to a template alignment 被引用次数:739 杂志:Bioinformatics, 2010, 26(2): 266-267. 作者:J. Gregory Caporaso, Kyle Bittinger, Frederic, D. Bushman, Todd Z. DeSantis, Gary L. Andersen and Rob Knight∗ 翻译人:刘冰渊 摘要 动机:最近比对空间终端 (NAST)工具在基于序列的微生物生态群体分析中被广泛使用,然 而由于原始方法执行起来的便携性不足的限制,这种方法的应用范围没能尽可能的扩大。基 于Python的最近比对空间终端工具 (PyNAST)是对NAST的一种全面的实现,包括三种方便的 用户接口:Mac OS X系统的图形用户接口,一个命令行接口,以及一个简单的应用程序编程 接口。 结果:PyNAST的可获取性将会使得受欢迎的NAST算法更加便携,使得用户可以在他们自己的 硬件上安装PyNAST,从而使其适用于数量级大的多的数据集指令。与此之外,由于用户可以 比较任意指定的模板比对物,这个特征通过原始的NAST网络接口是不能实现的,这使得NAST 算法为应用于微生物群体分析之外的全新任务做好了准备。 获取途径:PyNAST在网址上可以获取。 联系方式:rob.knight@ 1 简介 最近比对空间终端工具(DeSantis et al., 2006b)的开发是为了有效比对数以千计的 16S rRNA基因,其使用的是一种比对压缩算法,用以产生固定列数的多元序列比对(MSAs)。 Greengenes ribosomal数据库(DeSantis et al.,2006a)已经用NAST算法以400000个已知的 近乎完整长度的16S rRNA为参照,并且这个比对已经变成一个整合的工具用于微生物群体分 析。与此之外,用户已经通过网络接口/NAST,创造了特定项目 尺度下的MSAs。尽管NAST已经可以被广大的用户作为一个网络应用所获取,但是本地安装的 困难性限制了许多用户使用NAST的可能性。 这里,我们提出了基于Python的最近比对空间终端,使用PyCogent工具箱(Knight et al., 2007)对NAST算法进行了完全的实现。PyNAST加入的若干个关键的特征,体现了算法显著的 增强。新的特征包括: (1)三种方便的用户接口:Mac OS X系统的图形用户接口,一个命令行接口,以及一 个简单的应用程序编程接口; (2)分析关键步骤的参数化算法。[例如:逐对比对可以使用BLAST和MUSCLE算法计算 (Edgar, 2004), MAFFT (Katoh et al., 2005), ClustalW (Thompson et al., 1994),或者 是PyCogent逐对隐马尔科夫模型(HMM)比对,并且算法可以拓展到与新的逐对配对算法相结 合。 (3)开发尽可能少的依赖项(Python,NumPy和BLAST)的开源软件包,专为在单一机器 或集成环境下的简易安装而设计。 (4)能够比对任意序列与任意的序列模板比对物,而不仅仅是16S rRNA序列作为样本。 2 算法 NAST算法比对了一个候选序列与一个模板比对物。算法的输出值,比对后的候选序列, 保证与输入的模板比对物是等长度的。在原始NAST算法的实现中,每个用户提交的候选序列 都被用于和Greengenes数据库的‘Core Set(核心数据集)’相比对,这包括了大约5000个比 对了的非嵌合的序列,这些序列代表着当今被识别出的细菌和古生菌界的多样性。在PyNAST 算法中,用户可以用标准的fasta格式的比对物文件,指定任意的,需要用来比对的模板比 对物。 NAST算法应用于候选序列与模板比对物的方法如下。首先,用BLAST(Altschul et al., 1990)算法,识别出模板比对物中与候选序列最相似的序列。二者差异的部分在样本序列中 被删除,然后再将

文档评论(0)

wendang_12 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档