生物信息学-第四章.pdf

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
生物信息学-第四章

生物信息学-第四章 4 核酸与蛋白质结构和功能的预测分析 人们获得各种核酸和蛋白质序列的目的是了解这个序列在生物体中充当了怎样的角色。例如, DNA序列中重复片段、编码区、启动子、内含子/外显子、转录调控因子结合位点等信息;蛋白 质的分子量、等电点、二级结构、三级结构、四级结构、膜蛋白的跨膜区段、酶的活性位点、以 及蛋白质之间相互作用等结构和功能信息。虽然用实验的方法是多年以来解决这类问题的主要途 径,但新的思路是利用已有的对生物大分子结构和功能特性的认识,用生物信息学的方法通过计 算机模拟和计算来“预测”出这些信息或提供与之相关的辅助信息。由于生物信息学的特点,可 以用较低的成本和较快的时间就能获得可靠的结果。近10年来生物学序列信息的爆炸性增长大大 促进了各种序列分析和预测技术的发展,目前已经可以用理论预测的方法获得大量的结构和功能 信息。要注意的是,尽管各种预测方法都基于现有的生物学数据和已有的生物学知识,但在不同 模型或算法基础上建立的不同分析程序有其一定的适用范围和相应的限制条件,因此最好对同一 个生物学问题尽量多用几种分析程序,综合分析各种方法得到的结果和结果的可靠性。此外,生 物信息学的分析只是为生物学研究提供参考,这些信息能提高研究的效率或提供研究的思路,但 很多问题还需要通过实验的方法得到验证。 4.1 针对核酸序列的预测方法 针对核酸序列的预测就是在核酸序列中寻找基因,找出基因的位置和功能位点的位置,以及标记 已知的序列模式等过程。在此过程中,确认一段DNA序列是一个基因需要有多个证据的支持。一 般而言,在重复片段频繁出现的区域里,基因编码区和调控区不太可能出现;如果某段DNA片段 的假想产物与某个已知的蛋白质或其它基因的产物具有较高序列相似性的话,那么这个DNA片段 就非常可能属于外显子片段;在一段DNA序列上出现统计上的规律性,即所谓的“密码子偏好 性”,也是说明这段DNA是蛋白质编码区的有力证据;其它的证据包括与“模板”序列的模式相 匹配、简单序列模式如TATA Box等相匹配等。一般而言,确定基因的位置和结构需要多个方法 综合运用,而且需要遵循一定的规则:对于真核生物序列,在进行预测之前先要进行重复序列分 析,把重复序列标记出来并除去;选用预测程序时要注意程序的物种特异性;要弄清程序适用的 是基因组序列还是cDNA序列;很多程序对序列长度也有要求,有的程序只适用于长序列,而对 EST这类残缺的序列则不适用。 1. 重复序列分析 对于真核生物的核酸序列而言,在进行基因辨识之前都应该把简单的大量的重复序列标记出来并 除去,因为很多情况下重复序列会对预测程序产生很大的扰乱,尤其是涉及数据库有哪些信誉好的足球投注网站的程序。 多的重复序列。还可以把克隆载体也加入重复序列中,这样就可以在处理重复序列时顺便把克隆 载体也一同除去。经处理的序列中重复序列所在位置会一律由“X”代替。 CENSOR和Repbase的网址是: /。 生物信息学-第四章 CENSOR的Email服务地址是:censor@。 RepeatMasker的网址是: 下载XBLAST的网址是: /pub/jmc。 下载Repbase的网址是: 2. 数据库有哪些信誉好的足球投注网站 把未知核酸序列作为查询序列,在数据库里有哪些信誉好的足球投注网站与之相似的已有序列是序列分析预测的有效手 段,在上一节中已经专门介绍了序列比对和有哪些信誉好的足球投注网站的原理和技术。但值得注意的是,由相似性分析 作出的结论可能导致错误的流传;有一定比例的序列很难在数据库里找到合适的同源伙伴。对于 EST序列而言,序列有哪些信誉好的足球投注网站将是非常有效的预测手段。 3. 编码区统计特性分析 统计获得的经验说明,DNA中密码子的使用频率不是平均分布的,某些密码子会以较高的频率使 用而另一些则较少出现。这样就使得编码区的序列呈现出可察觉的统计特异性,即所谓的“密码 子偏好性”。利用这一特性对未知序列进行统计学分析可以发现编码区的粗略位置。这一类技术 等。 常见的编码区统计特性分析工具将多种统计分析技术组合起来,给出对编码区的综合判别。著名 的程序有GRAIL和GenMark等,GRAIL提供了基于Web的服务。 GRAIL的网址是: /Grail-1.3/。 4. 启动子分析 启动子是基因表达所必需的重要序列信号,识别出启动子对于基因辨识十分重要。有一些程序根 据实验获得的转录因子结合特性来描述启动子的序列特征,并依次作为启动子预测的依据,但实 际的效果并不十分理想,遗漏和假阳性都比较严重。总的来说,启动子仍是值得继续研究探索的 难题。 5. 内含子/外显子剪接位点 剪接位点一般具有较明显

文档评论(0)

asd522513656 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档