DNA序列及蛋白质序列的分析与比较.pdf

DNA序列及蛋白质序列的分析与比较.pdf

  1. 1、本文档共74页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

DNA、RNA和蛋自质都是由较小的单元组成的无分枝的线性聚合体大分子。对于

DNA,这些单元是A(腺嘌呤)、c(胞密啶)、G(鸟瞟呤)和T(胸腺嘧啶)这4种核苷酸

残基;对于RNA,这些单元是A、C、G和U(尿嘧啶)这4种核苷酸残基;对于蛋

白质这些单元是20种氨基酸残基,即A(N氨酸)、e(半胱氨酸)、D(天冬氨酸)、E(谷

氨酸)、F(苯丙氨酸)、G(甘氨酸)、H(组氨酸)、I(异亮氨酸)、K(赖氨酸)、L(亮氨

酸)、M(甲硫氨酸)、N(天冬酰氮酸)、P(脯氮酸)、Q(谷氮酰胺酸)、R(精氨酸)、s(丝

氨酸)、T(苏氨酸)、V(缬氨酸)、w(色氨酸)和Y(酪氨酸).这样,一个DNA(RNA)

序列可以看作是在一个有四个字母的字母表Ⅳ={A,G,G,T渺))上的字(word),同样,蛋

白质也可以看作是一个在20个字母上的字.在相当大的程度上,DNA、RNA和蛋自质

分子的化学性质编码在这些基本单元的线性序列中。因此,宇上的组合学和统计学的工

具和方法可以在研究生物分子单元线性序列上发挥很大的作用。

本文的主要工作包括以下几个方面:

在第一章,利用代数中同态的思想和物理学中的。粗粒化”思想,根据DNA序列中

四种核苷酸A、G、C和T的化学结构分类,提出DNA序列的特征序列的概念.一

个DNA序列的特征序列是一组(0,I)序列,它们中的每一个都是这个DNA序列的一个

简约表示,而且用它们中的任意两个都可以重新构造出这个序列;然后,利用特征序列

中所有【0,1)三元组出现的总数构造了一组2×2矩阵来表示序列.进一步,我们计算这

种压缩矩阵的最大特征值并把它作为DNA序列的一种不变量.基于这些DNA序列的不

变量我们分析了human,goat,gallus,opossum,lemur,nlouse,r

白(globin)基因序列的第一个外显子序列的相似性和非相似性;另外,我们试图通过比较

特征序列来找出嘌呤.嘧啶。酮基一氨基,弱氢键.强氢键分类可能显现出的生物功能.

第二章研究DNA序列的特征序列在基因识别算法中的应用。首先,我们给出DNA

序列的特征序列的一种数值刻划.利用这种数值刻划给出一个基因识别算法,并将这种

算法用在模式生物酿酒酵母菌基因组的分类数据库中,准确性超过95%.反过来将算法

应用到酿酒酵母菌基因组中进行基因识别,得到了一个酿酒酵母菌基因组申基因总数的

估计5897,与普遍接受的酿酒酵母菌基因组中基因数目5800-6000相符.

在第三章,我们将DNA序列的特征序列推广到蛋白质序列中.根据20种氨基酸的

物理化学性质,给出一种蛋白质序列的特征序列的概念来表示氨基酸的疏水性质和电价

性质,并给出蛋白质序列的特征序列一种数值刻划.然后,通过比较这些特征序列的数

值刻划得到一些蛋白质二级结构类全。螺旋,全卢折叠。和叩类蛋白质的一些关于疏

水性质和电价性质的信息.

在最后一章,我们利用代数的方法分析DNA序列和它们的三维图表示.首先,我

们给出DNA序列的三维图表示(DNA曲线)的一些代数的运算,并用对称群&作用到

DNA曲线上,从而得到DNA曲线的一些性质.其次,对于DNA曲线,我们定义了两种

等价关系,并得到一些与这两种等价关系相关的计数公式.在这一章的最后我们证明一

个与等价类的熵有关的不等式.

关键词:生物信息学、DNA序列、特征序列、蛋白质、蛋白质二级结构类、基因

组、基因识别算法、压缩矩阵、特征序列的数值刻划。

Abstract

DNA(deoxyribonucleicacid),RNA(ribonucleicacid),andmacromolecules

proteinall

are

fromthe

units.In

whichunbranchedbuiltsmallerofunits

al-epolymersupcaseDN

文档评论(0)

130****4895 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档