- 1、本文档共7页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
遗传密码格式的组合编码数分析.pdf
生物物理学报 第十八卷 第二期 二oo二年六月
ACTA B10PHYSICA SINICA Vo1.18 No.2 Jun.2002
遗传密码格式的组合编码数分析
陈惟 昌 , 陈志义 , 陈志华 , 王 自强
(1 中 日友好 临床医学研究所生物物理研究室 .北京 100029;2.中国科学院 自动化研究所国家模式识别实验室
北京 100080;3.中 日友好临床 医学研 究所生物化学及分子生物学研究室 ,北京 100029)
摘要 :用 Ⅳ 个密码子对 m 个编码 对象进行 编码的编码格 式是 m 元 Ⅳ维空 间中的一个顶点。64个 密码子 对
20种氨基酸和终止密码子进行编码格式的组合编码数是一个十分 巨大的数字。对 多元高维编码 空间的拓扑特性进
行 了分析和研 究 ,并 由此推导 出 m—N 空间的特性三 角的排 列方式以及给 出特性三角公 式的数 学证明 。指 出,目前
的遗传密码的编码格式是 21元 64维编码 空间的一个顶点 。应用组合数学分析 的方法 ,计算 了遗传密码格式 的最大
组 合编码 数 C :4.19×1 ,基 因组遗 传 密码 的组合 编码数 & :1.13×1。以及 线粒体 遗传 密码 的组合 编码数
:1.38×1c7等 。分析结果表 明,遗传密码 的指定是一个小概率事件 ,可能来源于 A简并后 的偶数三联密码配对
的组合编码 的对称破缺 。
关键词 :遗传密码 ;编码对 象(码 象)和编码元 (码子);组合编码数 ;多元高维空间 (高维栅格 空间);多项式
定理 ;特性三角(广义贾宪与 帕斯卡三角)
中图分类号 :Q617 文献标识码 :A 文章编号 :1000—6737(2002)02—0206—07
1961年 ,Nirenberg和 Matthaei…首次发现氨 的码元 ,按照译码规则 ,反过来确定被编码对象的过
基酸的遗传密码 ,为基因信息学奠定基础 。目前 已 程称为解码 (decoding)过程 。可用 以下方式表示 :
经知道 ,DNA 4个碱基 C,T,A,G可组成 64个三 encoding
联密码子 ,分别对 20种氨基酸和终止密码子进行编 c。dim =二二= c。d。n
码。由于 64大于 21,因此遗传密码子 出现简并现 decoding
象。据估计 ,类似于 目前遗传密码编码格式 的可 在码象的集合 ()中, 可以是一组具体的
能组合编码数至少为 10_7一1 ,这是一个巨大 的天 事物或符号 ,而在码元 的集合 Ⅳ(Y)中,Y通常是一
文数字。遗传密码为什么是现在这样的格式 ,一直 组符号 ,字母或数字。 ()一 Ⅳ(Y)代表编码过程 ,
是一个谜 。Crick 提 出 “冻结事故理论 ”(frozen 而 Ⅳ(Y)一M ()代表解码过程。根据编码规则 ,通
accidenttheorv),他认为 64个密码子分配给 20种 常一个码元 只能代表一个特定的码象以避免产生歧
氨基酸和终止密码子的编码格式 ,纯属于一次偶然 义性 (equivocality)。但一个码象可以有一个以上 的
性的事故。我们分析 了遗传密码 6维编码空间的拓 码元。所 以一般码元的数 目应大于或等于码象的数
扑特性 ,发现并确立遗传密码子的 “拓扑连通性简 目以保证每一个码象至少有一个码元与之对应。编
并法则” ,并找 出遗传密码子的简并和氨基酸的 码过程可看成是从码象集合 到码元集合 Ⅳ的映
分子质量 、等电点 以及残基的化学键结构之间的联 射 (mapping) 。但 由于一个码象可以对应于多个
系b。本文首先对 多元高维编码空间的拓扑特征进 码元,所 以编码映射是一种多值映射。由于不同的
行 了研究。对遗传密码格式的各种可能的组合编码
文档评论(0)