使用Bioperl模块作数据分析讲述.ppt

下载文档 降价啦

187
0
约8.9千字
约 68页
2017-03-08 发布于湖北
举报
版权申诉
保障服务

使用Bioperl模块作数据分析讲述.ppt

1、本文档共68页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

使用Bioperl模块作数据分析讲述

如何进行多序列比对实例10：调用应用程序clustalw进行序列比对 $factory为Clustalw模块的一个实例主要方法： new，参数中包含clustalw运行的主要参数，返回一个Clustalw模块的实例； align，以序列对象的数组地址为参数，调用clustalw程序进行多序列比对，返回一个AlignI模块的实例；分析管道2：胰腺核酸酶进化分析从远程数据库获取序列序列长度分析核苷酸序列的提取核苷酸序列翻译到蛋白质序列调用ClustalW进行多序列比对（蛋白质水平）根据蛋白质序列比对产生核苷酸序列比对进化距离的获取同义和非同义替代率的获取已知条件：文章(Zhang et al., 2002)中记录的17条胰腺核酸酶登录号: AF449628~AF449644 后续分析：水稻叶绿体蛋白质组的分析…. Outline Perl和Bioperl简介基本概念序列处理比对处理 +比对文件格式的转换 +进化距离的计算 +同义替换率(D_s)和非同义替换率(D_n)的计算 +序列联配的自动化进行 +比对处理的管道设计 Outline Perl和Bioperl简介基本概念序列处理比对处理序列格式介绍文件格式：embl fasta格式 embl格式序列文件格式的转换 1，提出问题：如何进行文件格式的转换?（实例1） fasta格式 genbank格式 embl格式序列文件格式的转换 2，是否已经相关代码？ Bioperl中SeqIO模块，封装了序列有关的文件读写通过use Bio::SeqIO;语句告诉程序要使用SeqIO模块方法参数返回值作用 new 序列文件、序列格式 SeqIO模块实例产生一个与文件关联的变量 next_seq 无序列（Seq模块实例）从文件中读取序列，但每次只读一条 write_seq 序列（Seq模块实例）成功返回1，否则0 往文件写一条序列 3，解决方案： 3.1 利用SeqIO模块中的new方法产生一个读实例 3.2 利用SeqIO模块中的new方法产生一个写实例 3.3 从读实例中取序列 3.4 通过写实例往文件存入序列 3.5 反复操作3.3和3.4，直到读实例中无序列可取序列文件格式的转换序列文件格式的转换 4，编写代码 $in和$out均为SeqIO模块的实例 $seq为Seq模块的实例序列文件格式的转换 5，运行代码：首先要准备好待转换的序列文件将上述代码保存到文件ex001.pl 在命令行上，进入工作目录在命令行上，键入命令perl ex001.pl 查看结果序列文件格式的转换 1.明确问题 -将某个序列文件的格式改成其它格式 2.寻找已经存在的代码 -Bio::SeqIO模块 3.确定解决方案 -分别产生一个读实例和一个写实例 -读实例不断地读取序列到内存 -同时写实例不断地把内存中的序列写到文件 4.编写代码 -关键变量$in, $out, $seq -while -修改 -调试 -修改 5.运行程序 DNA序列的翻译问题2：DNA序列的翻译？ ...... ...... 64密码子 20氨基酸+终止信号 DNA序列的翻译 $seq和$prot两个均为Seq模块实例 2，已存在的代码；3，解决方案；4：代码编写 DNA序列的翻译 5，运行代码后，结果展示如下：序列的统计信息：长度分布提出问题:如何统计每条序列的长度？（实例3）序列长度的计算 2，已存在的代码；3，解决方案；4代码编写： $seq为Seq模块实例序列长度的计算 5，运行代码后的结果展示：借助于其它程序，比如perl，Excel可以获得下图 Seq模块总结告诉程序要使用Seq模块？（即如何产生Seq模块实例？） 1，直接使用“use Bio::Seq;”语句；2，通过SeqIO模块中的next_seq方法；3，或者有关模块中的有关方法方法参数返回值 new 序列名称（id）、序列本身（一段字符串）…… Seq模块实例 id 无，或者序列的新名称序列名称 desc 无，或者序列的新描述序列描述 Length 无序列长度 seq 无，或者Seq模块实例的新序列序列（用一串字符表示） subseq 起始位点，终止位点子序列（一串字符） alphabet DNA，或者RNA，或者protein 序列类型 Revcom 反向互补序列(Seq模块实例) translate 终止符的表示，frame，密码子表…. (大多数情况下采用默认值) 翻译后的蛋白质序列(可以认为是Seq模块实例) get_SeqFeatures 无一系列的SeqFeatureI模块实例序列特征表问题4：如何解析