网站大量收购独家精品文档,联系QQ:2885784924

蛋白质结构和功能预测学习资料.ppt

  1. 1、本文档共169页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

由于表示和处理所有原子和溶剂环境的计算开销非常大**故结构相似的蛋白质会有某些相似的精细生物化学功能。对已知结构的蛋白质进行分类,搜寻同类蛋白的功能是预测目标蛋白功能的有效手段。*通过结构比对的保守性分析策略,可以有效的预测蛋白质功能。*基于机器学习的方法在功能预测上有着很大的成绩,如通过数据挖掘和机器学习方法的研究,分析两个数据对象之间的相似性的可变模型来预测功能。**它对于人们认识蛋白质的结构、功能和进化有着重要的意义。因此,蛋白质结构域的研究已成为生物信息学中的一个重要问题。*然而处在数据量急速增长的后基因组时代,人类专家的处理能力已无法满足数据分析的需要,这时自动化的预测方法显得尤为重要。*INGA:proteinfunctionpredictioncombininginteractionnetworks,domainassignmentsandsequencesimilarityINGAhttp://protein.bio.unipd.it/inga蛋白质结构域(domain)识别方法蛋白质结构域具有特定功能的基本结构单元既是蛋白质结构化分类的基础,又与蛋白质进化密切相关。自动化的结构域预测基于模板的方法从头预测的方法仅从序列信息来预测结构域的方法(从头预测)成为结构生物学和序列分析中的一个重要的问题。目前,许多机器学习方法已经被应用于蛋白质结构域预测中。递归的神经网络可使用的模型有基于长短记忆(LongShort-TermMemory,LSTM)递归网络的蛋白质结构域边界预测模型——IPSP-LSTM。该模型通过选择性记忆的递归方法对蛋白质序列中的长程相关性进行建模。该模型在整体结构域预测和多域蛋白质链的预测中的效果较好。在双域的预测中的敏感性和特异性更加平衡。支持向量机首先通过将种子序列与数据库中已知的序列相比较,生成多序列比对结果,对比对结果进行特征提取,这些特征能够直接或间接的反映蛋白质的结构属性及结构域信息,再运用信息论的方法将特征值信息最大化。使用支持向量机学习系统对提取的特征值进行分类,实现了从多变量到单分类结果的非线性映射。小结结构预测功能预测△※※课后习题查找一段蛋白质序列,使用介绍的工具预测其二级、三级结构及功能。*****对序列中的每一个残基,将与它N端紧邻的8个残基和C端紧邻的8个残基与它一起考虑。窗口中各个残基对中心残基二级结构的支持程度*该方法对数据库中同源序列的存在非常敏感*输入层用于输入蛋白质序列,隐含层的神经元是完成从氨基酸序列到蛋白质二级结构映射的关键,输出层有3个神经元,分别对应于H、E和L三种状态**氨基酸的理化性质对二级结构影响较大“疏水性”是氨基酸的一种重要性质,疏水性的氨基酸倾向于远离周围水分子,将自己包埋进蛋白质的内部。而制订的一套预测规则*时,这一片段就被预测为α螺旋*对于β折叠,也存在着一些特征的亲疏水残基间隔模式,原则上,通过在序列中搜寻特殊的亲疏水残基间隔模式,就可以预测α螺旋和β折叠。*将20种氨基酸残基分为亲水、疏水以及两性残基三类*预测不是基于一个序列而是一组序列中的所有序列的一致序列。***侧链的结构由其相互作用的侧链及水环境决定。将保守残基完整地复制到模型中,并对侧链重新预测,有可能达到更高的精度。*在这种情况下同源模建法因为序列一致性太低而失效*从而大大减少了预测蛋白质结构的难度。不需要预测二级结构,即直接预测三级结构,从而可以避免二级结构预测不准确的限制,是一种有潜力的预测方法。*利用折叠方式对模型进行预测,主要是针对网上数据库中没有高同源性模板的蛋白三级结构的预测。*即直接根据序列本身来预测其结构。*功能预测意义方法※蛋白质是调控和实现所有生物功能的分子机器。结构蛋白-胶原酶-维持和增强结缔组织机械酶-肌浆球蛋白-实现宏观和微观上的运动各种酶-参与生理功能某些蛋白质与DNA或RNA相互作用产生新的蛋白质意义深入理解生命运动规律更好地理解疾病发生机制,用于治疗和药物设计GeneOntology(GO)方法实验方法计算方法※(1)基于结构相似性的方法(2)基于三维基序的方法(3)基于表面的方法(4)基于机器学习的方法(1)基于结构相似性(similarity)的方法在进化中保守的蛋白质高级结构通常对应某些保守的生物化学功能找到一个结构相似的蛋白质,将其功能转移给功能未知蛋白质。准确性只有20%-50%不能单独用来预测蛋白质功能蛋白质间序列相似性高于40%时,该蛋白质同其序列相似蛋白可能有某些由保守序列发挥的

文档评论(0)

155****4925 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档