核苷酸和蛋白质序列为基础的数据库检索序列对位排列.ppt

核苷酸和蛋白质序列为基础的数据库检索序列对位排列.ppt

  1. 1、本文档共54页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
CUCCCUCCGUCCCACAAUAUAAGGGAUUUUGAGUUUUCGAUUGCAGUGUUUGACCACUCGUCUUAUUCAAAUUUUUUUUGUAAAUAUAAAAAAUGAAAAGUUGUGCUUAAAGUACUGUAUAUAAUAAAGUAAGUCACAAAUAAAAUAAAUAAUAAUUUCAAAAAAAAAAUGAAUAAAACGAGUGGUCAAACGUUGCAAACAAAAACUCAAAAUCCCUUAUAUUAUGGGAUGGAGGGAG * /content/31/13/3537.full Figure 1.?Multiple alignment of coding DNA. (A) How?alignment at the DNA level may lead to incorrectly aligned codon–codon boundaries. (B) How alignment of coding DNA at the amino acid level yields an alignment where analogous codon positions are properly lined up. The encoded amino acids are indicated at the bottom of (B) * /etblast3/ * * * * * * PAM:Point/percent accepted mutation, by Dayhoff 被进化所接受的点突变 BLOSUM: Blocks substitution matrix (PNAS, 1992) 基于较易比对的近缘物种的蛋白构建。BLOSUM更新,使用的数据量更大些,优先考虑。 BLOSUM是根据比对的保守区块中aa的变化构建的(局部比对),所以更适合发现蛋白质的保守区块。BLOSUM所有数据均来源于直接实验观察的结果,比如BLOSUM62源于60%左右同一性的基因家族成员之间的比对。BLOSUM80就是80%同一性。 PAM比对的所有aa都用上了(相似度85%序列的全局比对,共获得1572个变异)。PAM1数据来源于实验,而PAM250则是PAM1自乘250次得到,用于表征远缘序列。 这些矩阵都是对称的,因为无法确认是A-B还是B-A,所以认为概率上一样。 有意思的是,有研究表明BLOSUM62作者存在计算错误,但是确实很好用:Mark P Styczynski; Kyle L Jensen, Isidore Rigoutsos, Gregory Stephanopoulos (2008). BLOSUM62 miscalculations improve search performance. Nat. Biotech. 26 (3): 274–275. doi:10.1038/nbt0308-274. PMID * 基于相似性记分,可以提供两条序列相似性的评价 换个角度,还可以有距离记分,强调一条序列需要变化多少次才能变成另一条。这种记分可以用于进化分析,下节课讲。 * /wiki/Sequence_alignment 两条序列间可能的对位排列方式为(2^(2N))/sqrt(pi*N),其中N为较长的序列的长度。N=250时有10^149种,远远大于宇宙内所有原子的总数。 Needleman-Wunsch Algorithm: global alignment Smith-Waterman Algorithm: local alignment /wiki/File:Zinc-finger-dot-plot.png using the publicly available?DNAdot?tool 点阵分析还通常用于RNA二级结构分析,易于鉴别发卡结构 动态规划:/users/CH391L/Handouts/Lecture5-NBT-primer-dynamicprogramming.pdf * /wiki/BLAST high-scoring segment pair, HSP * * * * * * * 先计算出与每条序列比对的raw score 原始分,再采用统计学方法以原始分为基础计算最终Score。因为要考虑数据库里序列的总数目等等。 E value类似于P value,但不等于P value。当E0.01时和P极为相似。 * * * * 何时选择何种数据库: /Blast.cgi?CMD=WebPAGE_TYPE=BlastDocsDOC_TYPE=ProgSelectionGuide * /Blast.cgi?CMD=WebPAGE_T

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档