- 1、本文档共3页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
PyNAST一种用于比对序列与模板比对物的灵活工具.PDF
PyNAST:一种用于比对序列与模板比对物的灵活工具
英文题目:PyNAST: a flexible tool for aligning sequences to a template alignment
被引用次数:739
杂志:Bioinformatics, 2010, 26(2): 266-267.
作者:J. Gregory Caporaso, Kyle Bittinger, Frederic, D. Bushman, Todd Z. DeSantis,
Gary L. Andersen and Rob Knight∗
翻译人:刘冰渊
摘要
动机:最近比对空间终端 (NAST)工具在基于序列的微生物生态群体分析中被广泛使用,然
而由于原始方法执行起来的便携性不足的限制,这种方法的应用范围没能尽可能的扩大。基
于Python的最近比对空间终端工具 (PyNAST)是对NAST的一种全面的实现,包括三种方便的
用户接口:Mac OS X系统的图形用户接口,一个命令行接口,以及一个简单的应用程序编程
接口。
结果:PyNAST的可获取性将会使得受欢迎的NAST算法更加便携,使得用户可以在他们自己的
硬件上安装PyNAST,从而使其适用于数量级大的多的数据集指令。与此之外,由于用户可以
比较任意指定的模板比对物,这个特征通过原始的NAST网络接口是不能实现的,这使得NAST
算法为应用于微生物群体分析之外的全新任务做好了准备。
获取途径:PyNAST在网址上可以获取。
联系方式:rob.knight@
1 简介
最近比对空间终端工具(DeSantis et al., 2006b)的开发是为了有效比对数以千计的
16S rRNA基因,其使用的是一种比对压缩算法,用以产生固定列数的多元序列比对(MSAs)。
Greengenes ribosomal数据库(DeSantis et al.,2006a)已经用NAST算法以400000个已知的
近乎完整长度的16S rRNA为参照,并且这个比对已经变成一个整合的工具用于微生物群体分
析。与此之外,用户已经通过网络接口/NAST,创造了特定项目
尺度下的MSAs。尽管NAST已经可以被广大的用户作为一个网络应用所获取,但是本地安装的
困难性限制了许多用户使用NAST的可能性。
这里,我们提出了基于Python的最近比对空间终端,使用PyCogent工具箱(Knight et al.,
2007)对NAST算法进行了完全的实现。PyNAST加入的若干个关键的特征,体现了算法显著的
增强。新的特征包括:
(1)三种方便的用户接口:Mac OS X系统的图形用户接口,一个命令行接口,以及一
个简单的应用程序编程接口;
(2)分析关键步骤的参数化算法。[例如:逐对比对可以使用BLAST和MUSCLE算法计算
(Edgar, 2004), MAFFT (Katoh et al., 2005), ClustalW (Thompson et al., 1994),或者
是PyCogent逐对隐马尔科夫模型(HMM)比对,并且算法可以拓展到与新的逐对配对算法相结
合。
(3)开发尽可能少的依赖项(Python,NumPy和BLAST)的开源软件包,专为在单一机器
或集成环境下的简易安装而设计。
(4)能够比对任意序列与任意的序列模板比对物,而不仅仅是16S rRNA序列作为样本。
2 算法
NAST算法比对了一个候选序列与一个模板比对物。算法的输出值,比对后的候选序列,
保证与输入的模板比对物是等长度的。在原始NAST算法的实现中,每个用户提交的候选序列
都被用于和Greengenes数据库的‘Core Set(核心数据集)’相比对,这包括了大约5000个比
对了的非嵌合的序列,这些序列代表着当今被识别出的细菌和古生菌界的多样性。在PyNAST
算法中,用户可以用标准的fasta格式的比对物文件,指定任意的,需要用来比对的模板比
对物。
NAST算法应用于候选序列与模板比对物的方法如下。首先,用BLAST(Altschul et al.,
1990)算法,识别出模板比对物中与候选序列最相似的序列。二者差异的部分在样本序列中
被删除,然后再将
您可能关注的文档
- MCD3000缓冲启动器.PDF
- MCD3000缓冲启动器功率范围.PDF
- MD系列立体声音频解码器用户手册-Marian(麦润).PDF
- MEL71xx系列电流调整器.PDF
- MG-S4060双驱动侧边箱机使用说明书青岛麦格自动化设备-封箱机.PDF
- MGETMGalaxyTM-施耐德电机.PDF
- MIPIM-PHY发射机和接收机测试解决方案-泰克.PDF
- MK3I-DV数字显示直流电压表.PDF
- MotorsandTransformers电动机与变压器学生笔记.PDF
- MRC35遥控器使用指南-中华电信Mod.PDF
- 甘肃省酒泉市金塔县等4地2024-2025学年高一上学期11月期中考试数学试题【含解析】.pdf
- 浙江省宁波市余姚中学2024-2025学年度高二上学期10月月考数学试题【含解析】.docx
- 河南省商开大联考2022-2023学年高一上学期期中考试数学试卷【含解析】.pdf
- 重庆市开州中学2024-2025学年高二上学期第一次月考数学试题【含解析】.docx
- 云南省昆明仁泽中学2024-2025学年度高二上学期10月月考数学试卷【含解析】.docx
- 《环境文本数据加工处理技术规范》.pdf
- 《区域大气环境承载力监测预警技术规范》.pdf
- 《环境空气温室气体光声光谱法连续自动监测仪技术要求及检测方法》.pdf
- 《美丽城市建设数据分级分类规范》.pdf
- 《大数据优化区域空气质量模拟排放输入数据技术规范》.pdf
文档评论(0)