- 1、本文档共68页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
使用Bioperl模块作数据分析讲述
如何进行多序列比对 实例10:调用应用程序clustalw进行序列比对 $factory为Clustalw模块的一个实例 主要方法: new,参数中包含clustalw运行的主要参数,返回一个Clustalw模块的实例; align,以序列对象的数组地址为参数,调用clustalw程序进行多序列比对,返回一个AlignI模块的实例; 分析管道2:胰腺核酸酶进化分析 从远程数据库获取序列 序列长度分析 核苷酸序列的提取 核苷酸序列翻译到蛋白质序列 调用ClustalW进行多序列比对(蛋白质水平) 根据蛋白质序列比对产生核苷酸序列比对 进化距离的获取 同义和非同义替代率的获取 已知条件:文章(Zhang et al., 2002)中记录的17条胰腺核酸酶登录号: AF449628~AF449644 后续分析:水稻叶绿体蛋白质组的分析…. Outline Perl和Bioperl简介 基本概念 序列处理 比对处理 +比对文件格式的转换 +进化距离的计算 +同义替换率(D_s)和非同义替换率(D_n)的计算 +序列联配的自动化进行 +比对处理的管道设计 Outline Perl和Bioperl简介 基本概念 序列处理 比对处理 序列格式介绍 文件格式:embl fasta格式 embl格式 序列文件格式的转换 1,提出问题:如何进行文件格式的转换?(实例1) fasta格式 genbank格式 embl格式 序列文件格式的转换 2,是否已经相关代码? Bioperl中SeqIO模块,封装了序列有关的文件读写 通过use Bio::SeqIO;语句告诉程序要使用SeqIO模块 方法 参数 返回值 作用 new 序列文件、序列格式 SeqIO模块实例 产生一个与文件关联的变量 next_seq 无 序列(Seq模块实例) 从文件中读取序列,但每次只读一条 write_seq 序列(Seq模块实例) 成功返回1,否则0 往文件写一条序列 3,解决方案: 3.1 利用SeqIO模块中的new方法产生一个读实例 3.2 利用SeqIO模块中的new方法产生一个写实例 3.3 从读实例中取序列 3.4 通过写实例往文件存入序列 3.5 反复操作3.3和3.4,直到读实例中无序列可取 序列文件格式的转换 序列文件格式的转换 4,编写代码 $in和$out均为SeqIO模块的实例 $seq为Seq模块的实例 序列文件格式的转换 5,运行代码: 首先要准备好待转换的序列文件 将上述代码保存到文件ex001.pl 在命令行上,进入工作目录 在命令行上,键入命令perl ex001.pl 查看结果 序列文件格式的转换 1.明确问题 -将某个序列文件的格式改成其它格式 2.寻找已经存在的代码 -Bio::SeqIO模块 3.确定解决方案 -分别产生一个读实例和一个写实例 -读实例不断地读取序列到内存 -同时写实例不断地把内存中的序列写到文件 4.编写代码 -关键变量$in, $out, $seq -while -修改 -调试 -修改 5.运行程序 DNA序列的翻译 问题2:DNA序列的翻译? ...... ...... 64密码子 20氨基酸+终止信号 DNA序列的翻译 $seq和$prot两个均为Seq模块实例 2,已存在的代码;3,解决方案;4:代码编写 DNA序列的翻译 5,运行代码后,结果展示如下: 序列的统计信息:长度分布 提出问题:如何统计每条序列的长度?(实例3) 序列长度的计算 2,已存在的代码;3,解决方案;4代码编写: $seq为Seq模块实例 序列长度的计算 5,运行代码 后的结果展示: 借助于其它程序,比如perl,Excel可以获得下图 Seq模块总结 告诉程序要使用Seq模块?(即如何产生Seq模块实例?) 1,直接使用“use Bio::Seq;”语句;2,通过SeqIO模块中的next_seq方法;3,或者有关模块中的有关方法 方法 参数 返回值 new 序列名称(id)、序列本身(一段字符串)…… Seq模块实例 id 无,或者序列的新名称 序列名称 desc 无,或者序列的新描述 序列描述 Length 无 序列长度 seq 无,或者Seq模块实例的新序列 序列(用一串字符表示) subseq 起始位点,终止位点 子序列(一串字符) alphabet DNA,或者RNA,或者protein 序列类型 Revcom 反向互补序列(Seq模块实例) translate 终止符的表示,frame,密码子表…. (大多数情况下采用默认值) 翻译后的蛋白质序列(可以认为是Seq模块实例) get_SeqFeatures 无 一系列的SeqFeatureI模块实例 序列特征表 问题4:如何解析
您可能关注的文档
- 038308601建筑概论(七).doc
- 公路交通安全设施工高级工培训内容概要.doc
- 03中图版七年级地理上册第一章地球和地图第三节地形图.doc
- 你的形象--价值百万讲述.ppt
- 03中国大唐集团公司培训项目管理办法.doc
- 公路交通安全设施工中级工培训内容概要.doc
- 公路养护工路面养护知识讲座8概要.ppt
- 03价值流图析1.ppt
- 03利用柱状晶及其取向特征尝试发展高磁感无取向电工钢1022.doc
- 佳一数学2016年春季精英版教案三年级-7巧填数字与符号讲述.doc
- 2024-2025学年人教版小学数学四年级下册教学计划及进度表.docx
- 2024-2025学年北师大版小学数学二年级下册教学计划及进度表.docx
- 2024-2025学年人教版小学数学五年级下册教学计划及进度表.docx
- 2024-2025学年人教大同版(2024)小学英语三年级下册教学计划.docx
- 2024-2025学年人教精通版(三起)(2024)小学英语三年级下册教学计划.docx
- 2024-2025学年统编版初中道德与法治八年级下册教学计划及进度表.docx
- 2024-2025学年统编版(2024)初中道德与法治七年级下册教学计划及进度表.docx
- 2023-2024学年上海黄埔区中考二模综合测试(物理部分)试卷及答案.pdf
- 2024-2025学年外研版(三起)(2024)小学英语三年级下册教学计划及进度表.docx
- 2025届北京市北京第四中学高三冲刺模拟数学试卷含解析.doc
最近下载
- 王牌教师的课堂管理术心得.pptx
- 陕西省名校新高考物理100实验题合集含解析.pdf VIP
- 1.1《走近世界民间美术》课件人美版(2024))初中美术七年级下册.pptx
- 2025年高考数学总复习第一部分专题突破 新趋势 高考考向练.pptx VIP
- 膨胀节设计软件简介-波纹管软件.PPT
- 山东省第二届职业技能大赛国赛农产品食品检验项目技术工作文件.pdf VIP
- 中考数学备考策略与方法课件.ppt VIP
- 2025届高考专题复习:语言文字运用中的逻辑问题.pptx VIP
- 七年级历史下册 第一单元 综合测试卷(人教陕西版 2025年春).doc VIP
- itp护理课件可编辑.pdf VIP
文档评论(0)