- 1、本文档共63页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
生物信息学第六章分子进化与系统发育分析本章内容提要续密码子偏好及相应分析氨基酸序列的进化演变序列的进化演变同义与非同义的核苷酸替代系统发育树的构建分子钟与线性树第三节序列的进化演变基因组上存在着多种多样的区域例如蛋白质编码区非编码区内含子侧翼区重复片断以及插入序列等本章考虑蛋白质与的编码区的序列的进化演变模型进化模型法与两参数法两条序列的差异对于两条长度为的序列不同的碱基对为则两条序列的差异性可表示为核苷酸的改变转换颠换则当较小时如果核苷酸替代是随机发生的通常转换比颠换出现频率高转换颠换比核苷酸
生物信息学 第六章 分子进化与系统发育分析 本章内容提要 (续) 1. 密码子偏好及相应分析 2. 氨基酸序列的进化演变 3. DNA序列的进化演变 4. 同义与非同义的核苷酸替代 5. 系统发育树的构建 6. 分子钟与线性树 第三节 DNA序列的进化演变 1. 基因组上存在着多种多样的DNA区域,例如蛋白质编码区,非编码区,内含子,侧翼区,重复片断以及插入序列等 2. 本章考虑蛋白质与RNA的编码区的DNA序列的进化演变模型 3. 进化模型:Jukes-Cantor法与Kimura两参数法 两条DNA序列的差异 1. 对于两条长度为n的DNA序列,不同的碱基对为nd,则两条序列的差异性可表示为: 2. 核苷酸的改变:转换P、颠换Q,则p=P+Q 3. 当p较小时,如果核苷酸替代是随机发生的,Q=2P; 通常转换比颠换出现频率高; 4. 转换/颠换比: 核苷酸替代数的估计 Jukes-Cantor法 1. 假定任一位点的核苷酸替代的频率相等,且每一位点的核苷酸每年以α的概率演变为其他三种核苷酸的一种 2. 因此,一个核苷酸演变为其他三种核苷酸之一的概率为γ= 3α 3. 假设,在t年前分化出两条核酸序列X和Y, qt表示X和Y值之间相同核苷酸的比例值,pt=1-qt,表示X和Y之间不同的核苷酸的比例值 Jukes-Cantor法 (2) 4. 对于X和Y之间相同(qt)的核苷酸的一个位点,在时间t+1时(过了一年),以(1-γ)2的概率保持不变; 当γ较小时,γ2可以忽略,则qt+1=1-2γ 5. 对于X和Y之间不同(1-qt)的位点,假设在时间t时,X序列上的位点位i,Y序列上为j:如果X的i变成j,而Y上的j不变,则二者将相同;事件发生的概率为α(1- γ)=γ(1-γ)/3; 反之的概率是相等的。因此事件的总概率为:2γ(1-γ)/3,γ2忽略,则近似为: 2γ/3 Jukes-Cantor法 (3) 6. 因此,差分方程为: 7.令 , 则 8. Kimura两参数法 1. 对于实际数据,转换替代速率通常高于颠换速率;因此,每年每个位点转换替代率为α,颠换替代率2β 2. 可计算P,Q值为: 3. 4. P和Q可以从两条比对的序列中观测并计算得到 第四节 同义与非同义的核苷酸替代 1. 同义替代:编码区的DNA序列,核苷酸的改变不改变编码的氨基酸的内容 2.非同义替代:核苷酸改变,从而改变编码氨基酸的内容 3. 计算方法: A. 进化通径法 B. Kimura两参数法 C. 采用密码子替代模型的最大似然法 Ka/Ks:计算及含义 1. Ka:每个非同义位点的非同义替代数目 2. Ks:每个同义位点的同义替代数目 3. 一般计算公式:考虑序列上所有可能的同义位点(S)和非同义位点(N),通过双序列比对发现存在的同义位点(Sd)和非同义位点(Nd),存在: Ka/Ks:计算及含义 (2) 1. Ka/Ks ~ 1: 中性进化; 2. ka/Ks 1: 阴性选择,净化选择; 3. ka/Ks 1: 阳性选择,适应性进化 4. 多数基因为中性进化,约1%的基因受到阳性选择-决定物种形成、新功能的产生。 5. PAML, MEGA等工具:计算Ka/Ks及统计显著性 进化通径法:Nei-Gojobori 1. 首先需要考虑:潜在的同义(S)和非同义位点数(N) 2. 基本假设:所有核苷酸的替代率相等; 3. 用fi表示某一个密码子第i位的核苷酸上发生同义替代的比例;(i=1,2,3) 4. 所有密码子潜在的同义和非同义替代的位点数定义如下: ,n=3-s 潜在的同义和非同义位点数的估计 1. 例如,对于Phe, 密码子TTT, 第三位T变成C时为同义替代,变成A/G为非同义替代 因此: s=0+0+1/3 n=3-1/3=8/3 2. 终止密码子忽略不计;如Cys的TGT, s=0.5 整个序列的同义与非同义估计 1. 和N=3C-S; Sj为第j位密码子的 s值,C为所有密码子的总数 2. S+N=3C:所比较的核苷酸的总数 Sd与Nd的计算:进化通径 1. 当一对密码子仅存在一个差异时,可以立即判断是同义还是非同义,进化通径只有一种可能;例如对于GTT(Val)和GTA(Val),sd=1,nd=0;而对于ATT(I)和ATG(M),sd=0,nd=1 2. 一对密码子存在两个差异时:两种进化通径(简约法,即最少需要)。例如:比较TTT(Phe)和GTA(Val): (1) TTT(Phe)-GTT(Val)-GTA(Val) (2) TTT(Phe)-TTA(Leu)-GTA(
文档评论(0)