- 1、本文档共81页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
主要内容 §6.1 概述 §6.2 蛋白质结构分析 §6.3 二级结构预测 ? §6.4 三级结构预测 一、同源蛋白质结构预测 又称同源模型化方法 主要思想: 对于一个未知结构的蛋白质,找到一个已知结构的同源蛋白质,以该蛋白质的结构为模板,为未知结构的蛋白质建立结构模型。 依据: 任何一对蛋白质,如果两者的序列等同部分超过30%,则它们具有相似的三维结构,即两个蛋白质的基本折叠相同,只是在非螺旋和非折叠区域的一些细节部分有所不同。 一、蛋白质二级结构预测概述 蛋白质的二级结构预测的基本依据是: 每一段相邻的氨基酸残基具有形成一定二级结构的倾向。 二级结构预测问题是模式分类问题 二级结构预测的目标: 判断每一段中心的残基是否处于?螺旋、?折叠、转角(或其它状态)之一的二级结构态,即三态。 基本策略(1)相似序列→相似结构 QLMGERIRARRKKLK QLMGAERIRARRKKLK 二、蛋白质二级结构预测的意义 蛋白质二级结构预测不仅仅可以给出二级结构信息,在实际工作中有广泛的用途。 ① 由蛋白质二级结构统计分析得到的规则可用于全新蛋白质设计或蛋白质突变体的设计。 ② 当序列同源性较低时,二级结构的指认有助于确定蛋白质间结构与功能的关系。 ③ 在同源蛋白质模建中,二级结构预测有助于建立正确的序列比对关系。 ④ 在基于二级结构片段堆积的三级结构预测中正确的二级结构预测是第一步。 ⑤ 二级结构的预测有助于多维核磁共振中二级结构的指认,同时也有助于晶体结构的解析。 三、蛋白质二级结构预测的主要方法 二级结构预测的方法大体分为三代: 第一代是基于单个氨基酸残基统计分析 从有限的数据集中提取各种残基形成特定二级结构的倾向,以此作为二级结构预测的依据。 第二代预测方法是基于氨基酸片段的统计分析 统计的对象是氨基酸片段 片段的长度通常为11-21 片段体现了中心残基所处的环境 在预测中心残基的二级结构时,以残基在特定环境形成特定二级结构的倾向作为预测依据 第一代和第二代预测方法对三态预测的准确率都小于70%,而对?折叠预测的准确率仅为28?48%。 其主要原因是只利用局部信息 第三代方法:考虑多条序列的同源进化信息 运用长程信息和蛋白质序列的进化信息 准确度有了比较大的提高 1 Chou-Fasman方法 Chou-Fasman方法曾经是、现在仍然是最为普遍应用的方法。其基本出发点在于对于蛋白质20种不同的氨基酸残基在不同的二级结构中出现的几率进行统计分析得出在不同二级结构中出现的倾向性。 2 GOR方法 GOR(Garnier-Osguthorpe-Robson)方法基于信息论算法,是所有统计算法中理论基础最好的。 3 最近邻居方法 在最近邻居方法(nearest neighbor method)中新测定的序列被归类于与已知的最相近的序列具有相同的二级结构。 4 神经网络方法 相对而言神经网络方法便于应用,有较高的预测准确度。最大的缺点是没有明确的物理化学意义。 其中PHD方法 是广泛应用的预测方法。 5 基于多重序列比对的二级结构预测 基于单个序列的二级结构预测方法的预测准确度相对较低,大约在58%左右。而基于多重序列比对的二级结构预测方法PSI-PRED的预测准确度可达到77%。 四、二级结构预测的准确度 二级结构预测方法针对不同蛋白质所给出的准确度可能会有很大差别。 1)单序列的预测准确度在60%左右。 2)应用多重序列对比信息的二级结构预测准确度在 65%~85%之间。 五、二级结构在线预测 许多蛋白质二级结构预测程序可以从因特网上免费下载至本地计算机进行蛋白二级结构预测。另外,还可以进行在线计算:可以通过送Email的方式,也可以在因特网上实时计算。 可以进行二级结构在线预测两个网站为: 1.PHD算法 PredictProtein网站的地址为: / 2.SSPro 4.0(神经网络) / PredictProtein / 可以获得功能预测、二级结构、基序、二硫键结构、结构域等许多蛋白质序列的结构信息 该方法的平均准确率超过72%,最佳残基预测准确率达90%以上。因此,被视为蛋白质二级结构预测的标准。 需要学术邮箱注册 PredictProtein提交界面 1D序列预测 PROFsec(默认) 是PHDsec的改进版本:基于轮廓(profile)的神经网络算法预测蛋白质二级结构 PROFacc(默认) 基于轮廓(profile)的神经网络算法预测残基溶剂可及性 PHDhtm(默认) 基于多序列比对预测跨膜区位置和拓扑结构 ASP(默认) 识别二级结构中构型变化的氨基酸
文档评论(0)