- 1、本文档共4页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中国试剂网
生物信息学应用:序列分析,电子克隆等初探
生物信息学可指利用信息技术管理和分析生物学数据。这就意味着生物信息学所
涉及的范围相当广泛,从人工智能、机器人一直到基因组(genome)分析。就基因
组分析这一角度来看,生物信息学主要是指核酸和蛋白质序列数据的计算机处理
和分析。近年来,蛋白质结构数据的快速增长,使蛋白质三维结构的处理分析也
归入到生物信息学的范畴。
近年来,三大国际一级生物信息数据库,即美国国家信息中心 (National Center of
Biotechnology Information, NCBI) 的Gen Bank(http:/ / www. nchi. nlm. nih. gov/
web/Gen Bank/ imdex. html) 、欧洲分子生物学室验室(European Molecular Biology
L aboratory-Euro-pean Bioinformatics Institute, EMBL-EBI) 的 EM-BL (http:// ebi.
ac.uk/ databases/ index.html)和日本 DNA 数据库 (DNA Data Bank of Japan, DDBJ)
(http:/ / ddbj.nig.ac.jp/ )新收录的核酸序列数据中,EST 占65% 以上[18]。随着生
物信息学 (Bioinformatics) 的发展,通过检索数据库进行核酸序列同源性检索,
电子基因定位、电子延伸、电子克隆和电子表达以及蛋白质功能分析、基因鉴定
等方面起到了重要作用,已成为人们认识生物个体生长发育、繁殖分化、遗传变
异、疾病发生、衰老死亡等生命过程的有力工具。
1 核酸序列的同源性检索
目前,通过数据库查询、cDNA 文库直接测序、mRNA 差别显示 (DDRT-PCR) 、
代表性差示分析(RDA-PCR)和抑制差减杂交(SSH)等方法获得的EST 数据越来越
庞大。GenBank 数据库中收录的EST 序列有数百万个之多。由于 EST 代表着一
段表达基因序列,这样就可用其与公共数据库进行同源性检索,检索与其同源的
核酸序列。典型分析是采取NCBI 的Blast 软件对 GenBank 中的非冗余数据库
(non-redundant database,nr )进行查询。该数据库是对GenBank EMBL 和DDBJ
中去除所有相同核酸序列进行整合后所得的最为全面的已知基因数据库,其中包
括部分基因组序列。联网至“/blast/blast.cgi 选择数据
库“Nucleotide ”,利用blastn 程序进行同源性检索。”, 按照提示进行查询。
2 比较基因组分析
达尔文的进化论给比较基因组学提供了理论依据。动物进化从低等到高等,动物
中国试剂网
与动物之间存在着亲缘关系。这种关系可以从基因序列上反映出来。亲缘关系越
近,其基因序列的同源性就越高。可以根据已经亲缘关系较大的动物的基因序列
来扩增目的基因的序列。
3 利用Unigene 数据库进行电子克隆
此分析需要联网至“/blast/blast.cgi 选择数据库
“dbEST ”,利用blastn 程序进行同源性检索。一般情况下可从EST 数据库中检
索到一批与代分析序列高度同源的EST 序列。选择同源性比分最高的一条 EST
序列。从NCBI 的UniGene 数据库中进行检索,得到相应的UniGene 编号。获
得待分析序列的UniGene 编号以后,就可以将与UniGene Cluster 的所有核酸序
列下载到本地,利用SequencherTM 或其他的序列装配软件进行组装。形成较长
的新生序列。
4 cDNA 序列的开放阅读框分析
大量的实验证明,在真核生物起始蛋白质合成时,40S 核糖体亚基及有关合成起
始因子首先与 mRNA 模板靠近 5`末端处结合,然后向 3`末端滑行,发现 AUG
起始MM 子时,与60S 大亚基结合形成80S 起始复合物。开始转译蛋白质。这
就是Kozak 提出的
文档评论(0)