- 1、本文档共72页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
营销研究中国科技大学课件系列:生物信息学
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 同时进行全局和局部的双序列比对 对以上打分的结果设计权重系统,找到序列中最保守的部分 渐进方法的比对,基于上述计算的primary library * ClustalW/X:存在的问题 1. 距离最近的,有两组序列AB和CD,哪组最先比对?两种方案: A. 分别、同时比对。但是,是以AB为准,加入CD,然后再加上其他序列,还是CD为准?结果可能出入很大 B. 随机挑选一组作为基准 2. 当序列差异较大时,上述问题更加明显。 * 例如 1. 三条序列: 2.若Seq1,2先比对,再加入Seq3: 3. Seq1,3先比对,再加入Seq2: 4. Seq2,3先比对,再加入Seq1: Seq1: ARKCV Seq2: ARCV Seq3: AKCV ARKCV AR-CV A-KCV ARKCV A-RCV A-KCV ARKCV AR-CV AK-CV * 2. 迭代方法 1. 部分解决渐进算法存在的问题,主要是ClustalW/X存在的问题; 2. PRRP 3. DIALIGN * (1) PRRP 1. 先用“渐进”算法进行多序列比对; 2. 基于多序列比对的结果构建进化树; 3. 重新计算序列之间的距离,再用“渐进”算法进行多序列比对; 4. 重复上述步骤,直到结果不再发生改变为止。 * (2) DIALIGN 1. 对所有序列进行两两之间的局部最优化的比对; 2. 找到所有能够匹配的部分M1;将重叠的、前后连续(consistency)的匹配部分连接起来(diagonals),为M2; 3. 将剩下的未比对的序列重新比对,再发现能够匹配的部分,构成新M1,将consistency部分构成M2; 4. 重复上述步骤,直到结果收敛。 * DIALIGN: 算法流程 * 3. 部分有向图算法 * * 激酶的多序列比对 * 4. 隐马尔科夫模型: ProbCons 主要改进: 1. 所有序列的两两比对,通过profile HMM的方法进行双序列比对; 2. 将渐进算法与迭代算法整合; 3. 目前,性能最优。 * 5. 整合算法MUSCLE 算法分为三个部分,每个部分相对独立; 1. Draft progressive: (1) 对两条序列,计算距离采用k-mer的思想; (2) 用UPGMA算法构建引导树; (3) 使用渐进算法进行多序列比对; 优点:两条序列之间的距离不采用动态规划算法进行比对,节省时间。 * MUSCLE 2. Improved progressive: (1)基于k-mer得到的树可能会产生次优结果,因此,采用Kimura距离的方法对k-mer产生的树重新计算距离矩阵; (2)重新用UPGMA构建进化树; (3)使用渐进算法进行多序列比对; * 3. Refinement: (1)随机从进化树上挑出一条边,删除; (2)得到两组树,对每组树,计算profile; (3)将两组profile进行比对; (4)如果最终得分提高,保留结果,否则丢弃。 MUSCLE * MUSCLE的算法流程 * MUSCLE: 使用指南 /muscle/ * MUSCLE的使用 * 多序列比对:性能检验 1. BAliBASE:基于蛋白质结构,将同一家族的蛋白质序列进行多序列比较。 2. 检验多序列比对工具的性能:是否能够很好的重复BAliBASE中已明确的比对结果。 * AMP结合酶的结构/序列比较 * 性能比较 ProbCons:目前综合性能最好; T-Coffee:序列相似性高时最准确; DIALIGN: 序列相似性低时最准确; POA:性能接近T-Coffee和DIALIGN,速度最快; ClustalW/X: 最经典、被广泛接受的工具; MUSCLE: 目前最流行的多序列比对工具; * 运算时间比较 * * * * * * * * * * * * PAM250打分矩阵 * 打分矩阵的使用 PAM250: ~15-30%的序列相似性; PAM120: ~40%的序列相似性; PAM80: ~50% PAM60: ~60% 如何选择最合适的矩阵? 多种尝试… * PAM矩阵的问题及改进 1. PAM系列矩阵存在的问题: A. 氨基酸的打分矩阵,不关心核酸; B. 进化模型的构建需要系统发育树的分析,因此,成为一个循环论证的问题:序列比对?矩阵构建?打分?进行新的序列比对; C. 数据集很小; 2. 打分矩阵的改进 A. 选用大量的序列数据,
您可能关注的文档
- 电力企业现状与发展趋势.ppt
- 白酒的标准.ppt
- 的关税制度.ppt
- 的传统美食.ppt
- 的主要铁路干线.ppt
- 的国际储备.ppt
- 的农业课件.ppt
- 白领最辛苦的六大城市.ppt
- 的城乡一体化——以苏州为例.ppt
- 的农业(课件).ppt
- 2025届云南省巧家县巧家第一中学高三物理第一学期期中考试模拟试题含解析.doc
- 2025届河南省濮阳市物理高三上期末达标检测模拟试题含解析.doc
- 2025届四川省宜宾市南溪区第二中学校高二物理第一学期期中复习检测模拟试题含解析.doc
- 2025届广西柳州高级中学柳南校区物理高二第一学期期末预测试题含解析.doc
- 江苏省扬州中学2025届物理高一第一学期期末复习检测试题含解析.doc
- 河南省许汝平九校联盟2025届高一物理第一学期期中质量检测试题含解析.doc
- 上海华东师大三附中2025届高一物理第一学期期末达标检测模拟试题含解析.doc
- 2025届河北省滦县第二中学高二物理第一学期期末调研试题含解析.doc
- 2025届内蒙古阿拉善左旗高级中学物理高一第一学期期中综合测试试题含解析.doc
- 河南省南阳市第一中学校2025届物理高三第一学期期末学业质量监测试题含解析.doc
文档评论(0)