网站大量收购独家精品文档,联系QQ:2885784924

使用Bioperl模块作数据分析讲述.ppt

  1. 1、本文档共68页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
使用Bioperl模块作数据分析讲述

如何进行多序列比对 实例10:调用应用程序clustalw进行序列比对 $factory为Clustalw模块的一个实例 主要方法: new,参数中包含clustalw运行的主要参数,返回一个Clustalw模块的实例; align,以序列对象的数组地址为参数,调用clustalw程序进行多序列比对,返回一个AlignI模块的实例; 分析管道2:胰腺核酸酶进化分析 从远程数据库获取序列 序列长度分析 核苷酸序列的提取 核苷酸序列翻译到蛋白质序列 调用ClustalW进行多序列比对(蛋白质水平) 根据蛋白质序列比对产生核苷酸序列比对 进化距离的获取 同义和非同义替代率的获取 已知条件:文章(Zhang et al., 2002)中记录的17条胰腺核酸酶登录号: AF449628~AF449644 后续分析:水稻叶绿体蛋白质组的分析…. Outline Perl和Bioperl简介 基本概念 序列处理 比对处理 +比对文件格式的转换 +进化距离的计算 +同义替换率(D_s)和非同义替换率(D_n)的计算 +序列联配的自动化进行 +比对处理的管道设计 Outline Perl和Bioperl简介 基本概念 序列处理 比对处理 序列格式介绍 文件格式:embl fasta格式 embl格式 序列文件格式的转换 1,提出问题:如何进行文件格式的转换?(实例1) fasta格式 genbank格式 embl格式 序列文件格式的转换 2,是否已经相关代码? Bioperl中SeqIO模块,封装了序列有关的文件读写 通过use Bio::SeqIO;语句告诉程序要使用SeqIO模块 方法 参数 返回值 作用 new 序列文件、序列格式 SeqIO模块实例 产生一个与文件关联的变量 next_seq 无 序列(Seq模块实例) 从文件中读取序列,但每次只读一条 write_seq 序列(Seq模块实例) 成功返回1,否则0 往文件写一条序列 3,解决方案: 3.1 利用SeqIO模块中的new方法产生一个读实例 3.2 利用SeqIO模块中的new方法产生一个写实例 3.3 从读实例中取序列 3.4 通过写实例往文件存入序列 3.5 反复操作3.3和3.4,直到读实例中无序列可取 序列文件格式的转换 序列文件格式的转换 4,编写代码 $in和$out均为SeqIO模块的实例 $seq为Seq模块的实例 序列文件格式的转换 5,运行代码: 首先要准备好待转换的序列文件 将上述代码保存到文件ex001.pl 在命令行上,进入工作目录 在命令行上,键入命令perl ex001.pl 查看结果 序列文件格式的转换 1.明确问题 -将某个序列文件的格式改成其它格式 2.寻找已经存在的代码 -Bio::SeqIO模块 3.确定解决方案 -分别产生一个读实例和一个写实例 -读实例不断地读取序列到内存 -同时写实例不断地把内存中的序列写到文件 4.编写代码 -关键变量$in, $out, $seq -while -修改 -调试 -修改 5.运行程序 DNA序列的翻译 问题2:DNA序列的翻译? ...... ...... 64密码子 20氨基酸+终止信号 DNA序列的翻译 $seq和$prot两个均为Seq模块实例 2,已存在的代码;3,解决方案;4:代码编写 DNA序列的翻译 5,运行代码后,结果展示如下: 序列的统计信息:长度分布 提出问题:如何统计每条序列的长度?(实例3) 序列长度的计算 2,已存在的代码;3,解决方案;4代码编写: $seq为Seq模块实例 序列长度的计算 5,运行代码 后的结果展示: 借助于其它程序,比如perl,Excel可以获得下图 Seq模块总结 告诉程序要使用Seq模块?(即如何产生Seq模块实例?) 1,直接使用“use Bio::Seq;”语句;2,通过SeqIO模块中的next_seq方法;3,或者有关模块中的有关方法 方法 参数 返回值 new 序列名称(id)、序列本身(一段字符串)…… Seq模块实例 id 无,或者序列的新名称 序列名称 desc 无,或者序列的新描述 序列描述 Length 无 序列长度 seq 无,或者Seq模块实例的新序列 序列(用一串字符表示) subseq 起始位点,终止位点 子序列(一串字符) alphabet DNA,或者RNA,或者protein 序列类型 Revcom 反向互补序列(Seq模块实例) translate 终止符的表示,frame,密码子表…. (大多数情况下采用默认值) 翻译后的蛋白质序列(可以认为是Seq模块实例) get_SeqFeatures 无 一系列的SeqFeatureI模块实例 序列特征表 问题4:如何解析

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档