网站大量收购闲置独家精品文档,联系QQ:2885784924

第五章计算机在分子生物学中的应用.pptx

第五章计算机在分子生物学中的应用.pptx

  1. 1、本文档共150页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第五章 计算机在分子生物学中的应用 DNA双链模型 5.1 计算机在分子生物学中应用的简介 分子生物学研究的对象往往是大规模的实验数据,利用手工计算来处理这些数据显然是力不从心. 例如越来越多的物种的基因组将基本上完全地测定。那种倾毕生精力研究一个基因、一条代谢途径、一种生理周期的时代已经过去. genbank数据增长示意图 那种倾毕生精力研究一个基因、一条代谢途径、一种生理周期的时代已经过去。人们正在阐明细胞内的全部互相耦合的调控网络和代谢网络,细胞间的全部信号传导过程,从受精卵到成体的全部生理和病理的基因表达的变化等等。这一切都超出手工分析的可能性,数据的产生、搜集和分析,都必须依靠计算机和网络,都必须发展数据库、算法和程序。 计算机科学的发展及其在生物学领域的应用,已经成为生物学发展和进步过程中不可替代的重要力量。计算机在分子生物学发展中的作用是无可替代的。 在分子生物学中,DNA、RNA和蛋白质都是表现为特定的序列。不同生物的DNA或蛋白质的相似性是多方面的,可能是核酸或氨基酸序列的相似性,也有可能是结构的相似性。 生物功能分子的序列测序与功能预测是从序列中发现基因的两个层次。测序的大致步骤如下: 取DNA目标序列 ; 查找开放阅读框架(ORF)并将目标序列翻译成蛋白质序列; 据库中进行序列有哪些信誉好的足球投注网站; 进行目标序列与有哪些信誉好的足球投注网站得到的相似序列的整体列线(global alignment) ; 查找基因家族 查找目标序列中的特定模序 预测目标序列结构 获取相关蛋白质的功能信息把目标序列输入“提醒”服务器 5.2.1序列比较中的计算机技术 从生物学的角度而言,一个普遍的规律是:序列决定结构,结构决定功能。序列的比较一般不考虑空间结构或功能的相似性。研究序列的相似性的另一个目的是通过序列的相似性,判别序列间的同源性,推测序列间的进化关系。 序列比较的作用是:发现生物序列中的功能、结构和进化的信息,从而发现其中的相似性,找出序列间的共同区域,同时辨别序列之间的差异 5.2.1.1、序列的相似性 台戏在计算机内部,不管是DNA、RNA还是蛋白质,都是用特定的字符集来表示的。对于一种未知功能的生物分子,则可以通过将它的序列与已知功能的分子的序列进行比较来推断。序列的相似性可以用定性的方法来描述,也可以用定量的方法表示。 在讨论到序列相似性的关系时,经常会遇到同源(homology)和相似(similarity)两个概念。 所谓同源序列,简单地说,是指从某一共同祖先经趋异进化而形成的不同序列。 相似性(similarity)和同源性(homology)是两个完全不同的概念。 相似性概念的含义比较广泛,除了上面提到的两个序列之间相同碱基或残基所占比例外,在蛋白质序列比对中,有时也指两个残基是否具有相似的特性,如侧链基团的大小、电荷性、亲疏水性等。 序列比较的基本操作是比对(align),它是一种关于序列相似性的定性描述,反映的主要是在什么部位两条序列相似或差异。如果一个比对方法能够揭示两条序列的最大相似程度或根本差异,就称这个比对是最优比对。 1.字符表和序列: 在计算机中处理生物功能分子的序列比对时,将其序列抽象为字符串,这些字符串从一个特定的字符集合中抽取,这个字符集合称为:字符表。 如教材中的表5.1和表5.2 在分子生物学研究的一些场合,常常要用到子序列,如:分析功能基因或是保守序列,重复序列。生物序列中的子序列在形式上看起来同计算机数据结构中的子串的概念很相近,但实际上子序列和子串还是有些不同的:子序列的范围包含了子串,所有的子串都是子序列,但子序列不一定是子串。子序列可以通过对序列进行选择,删除等操作或取。例如: 基因片段1的序列为:ATTTTGCCCTTA,基因片段2的序列是:AGCT,基因片段3的序列是:TTGC。则片段2是片段1的子序列,但2不是1的子串,片段3是片段1的子串。 如果有两个生物分子序列分别为t和s,则当t为s的子串时,称s是t 的超串。如果t是s 的子串,也称t是s的连续子序列。 生物功能分子中的序列比对根据比较的范围不同可以分成全局比较和局部比较两种。全局比较指的是比较两条完整的序列,而局部比较指的是找出最大相似的子序列。对于两条序列的比对,根据不同的应用场合,常常将序列比较分成以下几种基本操作: (1)判断一个序列是不是另一个序列的子序列; (2)寻找两个序列中的最大相似子序列; (3)寻找两个相似序列中的细微差别; (4)判断一个序列的特定部份(如前缀或后缀)与另一个序列的特定部份是否相同。 其中,(1)和(3)是全局比较,(2)和(4)是局部比较。 2.编辑距离 对于两条DNA序列,有时很难看出它们有相似的地方,但是只要对其中的一条序

文档评论(0)

职教魏老师 + 关注
官方认证
服务提供商

专注于研究生产单招、专升本试卷,可定制

版权声明书
用户编号:8005017062000015
认证主体莲池区远卓互联网技术工作室
IP属地河北
统一社会信用代码/组织机构代码
92130606MA0G1JGM00

1亿VIP精品文档

相关文档