chapter3序列比较new3.ppt

  1. 1、本文档共145页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
chapter3序列比较new3.ppt

序 列 比 较 序列比较的根本任务是: 发现序列之间的相似性 辨别序列之间的差异 目的: 相似序列 ? 相似的结构,相似的功能 判别序列之间的同源性 推测序列之间的进化关系 第一节 序列的相似性 同源(homology)- 具有共同的祖先 直向同源(Orthologous ) 共生同源(paralogous ) 相似(similarity) —同源序列一般是相似的 — 相似序列不一定是同源的 — 进化趋同(同功能) 序列的相似性描述 定性的描述 定量的数值 相似度 距离 序列比较的基本操作是比对(Alignment) 两个序列的比对是指这两个序列中各个字符的一种一一对应关系,或字符的对比排列 。 1、字母表和序列 字母表 4字符DNA字母表:{A, C, G, T} 扩展的遗传学字母表或IUPAC编码 单字母氨基酸编码 1、字母表和序列 特定的符号 ? ? — 代表字母表 A* — 代表由字母表A中字符所形成的一系列有限长度序列或字符串或序列的集合 ? a、b、c—代表单独的字符 ? s、t、u、v—代表A*中的序列 ? |s|—代表序列s的长度 为了说明序列s子序列和s中单个字符,在s中各字符之间用数字标明分割边界 例如,设s=ACCACGTA,则s可表示为 0A1C2C3A4C5G6T7A8 i:s:j 指明第i位或第j位之间的子序列, 当然,0 ? i ? j ? |s|。 子序列0:s: i 称为前缀,即prefix(s,i) 子序列 i:s:|s|称为后缀,即suffix(s, |s|-i) i:s: i — 为空序列 j-1:s:j —表示s 中的第j 个字符,简记为sj 子序列与子串 子序列:选取s中的某些字符(或删除s中的某些字符)而形成s的子序列 例如: TTT 是 ATATAT的子序列。 s的子串: 是由s中相继的字符所组成。 例如: TAC是AGTACA的子串, 但不是TTGAC的子串(是子序列)。 子串是子序列 子序列不一定是子串 字符串操作 字符串连接操作: 两个序列s和t的连接: s + + t 例如: ACC++CTA = ACCCTA 字符串k操作— 删除字符串两端的字符 其定义如下: prefix(s,l) = sk|s|-l suffix(s,l) = k|s|-ls i:s:j = kisk|s|-j 序列比较可以分为四种基本情况: (1)两条长度相近的序列相似 ?找出序列的差别 (2)判断一条序列的前缀与另一条序列的后缀相似 (3)判断一条序列是否是另一条序列的子序列 (4)判断两条序列中是否有非常相似的子序列 2、编辑距离(Edit Distance) 两条序列的相似程度的定量计算 相似度,它是两个序列的函数,其值越大,表示两个序列越相似 两个序列之间的距离。距离越大,则两个序列的相似度就越小 字符编辑操作(Edit Operation) 字符编辑操作可将一个序列转化为一个新序列 Match(a,a) Delete(a,-) Replace(a,b) Insert(-,b) 扩展的编辑操作 ACCGACAATATGCATA ? ? ? ? ? ATAGGTATAACAGTCA 4、 序列的两两比对 序列的两两比对 (Pairwise Sequence Alignment) 按字符位置重组两个序列,使得两个序列达到一样的长度 5、打分矩阵(Weight Matrices) (1)核酸打分矩阵设DNA序列所用的字母表为 ? = { A,C,G,T } a. 等价矩阵 b. BLAST矩阵 c. 转移矩阵(transition,transversion) (嘌呤:腺嘌呤A,鸟嘌呤G;嘧啶:胞嘧啶C,胸腺嘧啶T) (2)蛋白质打分矩阵 (i)等价矩阵 (ii) 氨基酸突变代价矩阵GCM (iii)疏水矩阵 (iv)PAM矩阵(Point Accepted Mutation) (v) BLOSUM矩阵 (Blocks Amino Acid Substitution Matrices) 构造PAM-1矩阵(1

文档评论(0)

报告论文库 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档