网站大量收购闲置独家精品文档,联系QQ:2885784924

蛋白质Cα原子接触数数字特征分析.docVIP

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
蛋白质Cα原子接触数数字特征分析

蛋白质Cα原子接触数数字特征分析   摘要:Cα是蛋白质分子中的重要原子,是蛋白质折叠和设计中的重要研究对象。本文根据α-氨基酸和Cα原子的理化特性,引入接触数的概念,从数字特征方面研究蛋白质中Cα原子空间拓扑结构。主要利用结构规律统计与计算机模拟手段,对1653个蛋白质PDB进行了处理分析,对Cα原子数目所占比例、Cα原子平均接触数、接触数变化率进行了讨论。最后以1EXS为例加以说明,其中多于65%的Cα原子间距大于3个原子单位,平均接触数变化率在4-10之间波动较大,且Cα原子分布不均匀。本文是关于生物、统计学科结合的研究,在数字表征、数据挖掘层面上,分析了Cα原子,为人工组合蛋白质提供了数字支持;同时也对氨基酸理化特性指出了以Cα原子为基准的新方向。   关键词:蛋白质 Cα原子 平均接触数 数字特征      1 引言    研究蛋白质的结构,有助于了解蛋白质的作用,了解蛋白质如何行使其生物功能,认识蛋白质与蛋白之间的相互作用,这无论是对于生物学还是对于医学和药学,都是非常重要的。   目前,研究蛋白质结构普遍使用的方法是实验,理论分析和计算。学者江凡[1]介绍了X射线晶体学、二维核磁共振和低温冷冻电镜等蛋白质空间结构的实验测定方法。文献[2]应用统计分析方法,利用数据挖掘中的数据分布拟合理论对生物科学领域中的蛋白质侧链空间结构进行统计分析。以世界上广泛使用的生物分子三维结构数据库PDB为基础,利用残基侧链碳原子间距离的统计分析方法,文献[3-4]用统计和几何方法给出了氨基酸在蛋白质空间结构中的深度计算,并利用PDB数据库得到了不同氨基酸在蛋白质中的深度倾向性因子,并得到了这些倾向性因子与氨基酸的物理、化学综合特性的相关性质。文献[5]就蛋白质结构预测的方法和应用进行了综述,介绍了比较建模、折叠识别、从头计算等3种方法及其在结构基因组学研究、药物设计、蛋白质设计中的应用,并且对蛋白质结构预测存在的主要问题进行了讨论,指出了今后蛋白质结构预测研究重点在于优化比对算法和计分函数以及膜蛋白的结构预测。文献[6]以“相对熵”作为优化函数,仅用蛋白质主链上的两两连续的Cα原子间的距离信息以及20 种氨基酸的接触???的一个扩展形式,提出了一个有效快速的折叠预测优化算法,对几个真实蛋白质做了算法测试,预测构象相对于它们天然结构的均方根偏差为5~7a.u,本文坐标和距离所用单位皆为原子单位,且省略书写单位符号a.u。文献[6]的工作表明Cα原子在α-氨基酸中的重要作用决定着整体分子的性质与物理形态。但没有计算Cα原子的接触数及其数学特征。文献[7-9]讨论了蛋白质的结构和性质,提出进一步研究的必要性与可能性。    因此,本文应用数理统计方法,研究蛋白质中Cα原子构成的空间拓扑结构及数字特征。文中第二节在引入接触数的基础上,对Cα原子的数字特征进行了统计计算。第三节对Cα原子接触数进行实例分析。      2 Cα原子接触数数字特征    Cα原子指的是对应残基上最接近羰基的碳原子,是主链骨架的组成原子,起到了 “桥梁”的作用。为了对Cα原子的空间拓扑结构加以讨论,我们引入接触数的概念,同时结合Cα原子自身特点,给出了Cα原子接触数的应用。   2.1 Cα原子的平均接触数    Cα原子指的是对应残基上最接近羰基的碳原子,是主链骨架的组成原子。在α-氨基酸中,如图1所示,Cα原子连接着4个不同类别的原子或基团:一个氨基、一个羧基、一个氢原子(略去氢原子)和一个条侧链。   假设:    (1)某个蛋白质分子包括N个原子,其中有n个Cα原子,记为CA1,CA2,…,CAn。    (2)所有的原子散布在蛋白质分子空间。简化处理分子结构,选择以原子为基准的立体空间结构(不考虑其他的基团)。    Cα原子的平均接触数定义如下:    对于第i个Cα原子CAi,坐标(xi,yi,zi)。以CAi为球心,r为半径作一个球Ω,统计Ω内部包含的Cα原子的个数(不包括CAi),记为Ki,即球Ω内部除CAi外包含有Ki个Cα原子。则我们称Ki为CAi原子的接触数。令      则为该蛋白质分子Cα原子的平均接触数。显然,及是关于r的增函数,表示为:      2.2 平均接触数计算的实现   2.2.1数据预处理   (1)导入目标数据。即打开已有的1653个蛋白质分子PDB文件,选择每个分子中所有ATOM的相应数据导入。   (2)提取与统计数据。重点利用PDB文件中原子(尤其是Cα原子)的信息。   2.2.2 Cα原子的平均接触数的计算   (1)构造距离矩阵 。其中表示CAi与CAj之间的距离,即      (2)对于每一Cα原子CAi,以其为球心,求在半径为时,该原子的接触数。

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档