pairwise alignment研究生生物信息学课件03.ppt

pairwise alignment研究生生物信息学课件03.ppt

  1. 1、本文档共53页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
pairwise alignment研究生生物信息学课件03

双序列比对 什么是序列比对? 序列比对(Sequence Alignment)是通过在序列中有哪些信誉好的足球投注网站一系列单个性状或性状模式来比较2个(双序列比对)或更多(多重序列比对)序列的方法 序列比对分类 双序列比对:两条序列的比对 多序列比对:三条或以上序列的比对 我们为什么关注序列比对 相似的序列可能具有相同的功能与结构 发现一个基因或蛋白哪些区域容易发生突变,哪些位点突变后对功能没有影响 发现生物进化方面的信息 同源性(Homologous Genes) :序列来自共同的祖先,或具有共同的进化史,相似的序列往往具有同源性(如图) 相似性(Similarity):两序列根据某种参数相近,但相似的序列不一定具有同源性。相似性≠同源性,两基因只有同源与非同源关系 我们为什么关注序列比对(续) 直系同源(Orthologs):具有共同祖先与相似功能的同源基因(无基因复制事件) 旁系同源(Paralogs):两个物种A和B的同源基因,分别是共同祖先基因组中由复制事件而产生的不同拷贝的后代 趋同进化(Convergent evolution):序列中的相似区域可能不具有共同的祖先,而是通过两条进化路径独立获得相同的功能(如图) 同源序列与祖先序列关系 基因进化 记分矩阵与空位罚分 DNA 计分矩阵 蛋白质计分矩阵 广泛使用的两种矩阵 PAM BLOSUM 空位罚分 转换和颠换 转换和颠换 PAM( Point Accepted Mutation)矩阵 氨基酸记分系统需要替换的模式来提高灵敏度以检测弱的相似性 氨基酸容易被其它生化、物理特性相似的氨基酸替换 PAM矩阵给出了进化过程中同源蛋白质从一个氨基酸变到另一个氨基酸的似然率(Likelihood) PAM1(1个PAM单位)被定义为每100个残基出现一个被接受的点突变(氨基酸的置换不引起蛋白质功能上的显著变化) PAMn是PAM1自乘n次 PAM250、PAM120、PAM80和PAM60矩阵可用于相似性分别为20%、40%、50%和60%的序列比对 BLOSUM矩阵 (Blocks Substitution Matrix) BLOSUM62 空位罚分(Gap Penalties) 空位为了获得两个序列最佳比对,必须使用空位和空位罚分 空位罚分分为:空位开放罚分(Gap opening penalty)和空位扩展罚分(Gap extension penalty) 最优的序列比对通常具有以下两下特征: 尽可能多的匹配 尽可能少的空位 插入任意多的空位会产生较高的分数,但找到的并不一定是真正相似序列 双序列比对方法 点阵序列比较(Dot Matrix Sequence Comparison) 动态规划算法(Dynamic Programming Algorithm) 词或K串方法(Word or K-tuple Methods) 贝叶斯统计方法(Bayesian Statistical Methods) 点阵序列比较(Dot Matrix Sequence Comparison) 点阵分析是一种简单的图形显示序列相似性的方法,GibbsMcIntyre(1970) 沿X轴上序列1中的每一个单元(核苷酸或氨基酸)与沿Y轴的第二个序列中的每一个单元进行比较,相同的区域在点阵图中显示为由点组成的对角线,对角线之外零散的点为背景噪音 点阵分析的应用 自身比对 寻找序列中的正向或反向重复序列 蛋白质的重复结构域(domain) 相同残基重复出现的低复杂区(Low Complexity) RNA二级结构中的互补区域等 对两条序列的相似性作整体的估计 点阵分析的应用 点阵分析实例 编码噬菌体λcⅠ(水平轴)和噬菌体P22 c2(垂直轴)的氨基酸序列间的点阵分析 相同的点打印全部打印,很难找到有用的信息 使用滑动窗口技术降低噪声 使用滑动窗口技术降低噪声 点阵分析的优缺点 优点 直观性,整体性 点阵分析不依赖空位(gap)参数,可寻找两序列间所有可能的残基匹配 不依赖任何先决条件,是一种可用于初步分析的理想工具 点阵分析允许随时动态地改变最高和最低界限值,可以用来摸索区分信号和背景标准的严格程度 点阵分析的优缺点 缺点 不能很好地兼容距离矩阵 滑动窗口和预值的选择过于经验化 信噪比较低 不适合进行高通量的数据分析 动态规划算法 动态规划算法(Dynamic Programming Algorithm)是综合运用分级决策方法和最优化原理而形成的数学方法。 主要思路是把一个复杂问题分成若干个关联的子问题,找出子问题的最优解,进而得出原来复杂问题的最优解。 动态规划算法 在序列比对尤其是双序列比对中非常重要。将比对过程分为若干步,每一步增加一个位

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档