基因组学3)课件.ppt

  1. 1、本文档共51页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基因组学3)课件.ppt

华东理工大学生物科学专业核心课程 导论:基因组与基因组学 DNA连续序列的测序 DNA连续序列的测序 3 B DNA连续序列的组装 借助前述多种测序方法人们可以获得不超过1000bp的大量的DNA连续序列,但高等真核生物细胞内的一条染色体DNA就有数千万碱基对,因此要完成整条染色体基因组的总序列,必须将先前测序的大量DNA连续序列按一定的策略排列组装在一起,此类工作在基因组测序中被归为DNA连续序列的组装,简称序列组装(拼装)。序列组 装主要包括鸟枪法和克隆重叠群法两大战略。 3 B DNA连续序列的组装 a 基于鸟枪法的序列组装 鸟枪法组装基因组序列的基本原理 染色体基因组 基因组全序列 随机切断 分别测序 序列组装(比对重叠区) 连续测序片段 鸟枪法组装原核生物的小型基因组序列 原核生物的基因组中很少存在长于15bp的相同序列,因此理论上来说,只要两个基因组DNA随机片段的末端存在15bp以上的重叠区,那么基本上可以断定两者在染色体上是前后相连的关系。1995年由美国Celera Genomics公司发表的1830kb的流感嗜血杆菌(Haemophilus influenzae)基因组序列就是在没有借助于任何遗传图谱或物理图谱 的条件下完成DNA连续序列组装的。 鸟枪法组装原核生物的小型基因组序列 采用高频超声波机械打断从细菌细胞中提取的基因组DNA,经琼脂糖凝胶电泳分离后,割取DNA片段长度在1.6-2.0kb范围内的凝胶区域,回收 流感嗜血杆菌基因组的测序程序 纯化其中的DNA片段。 鸟枪法组装原核生物的小型基因组序列 将上述1.6-2.0kb的DNA与质粒载体连接,转化大肠杆菌,构成流感嗜血杆菌的基因组文库。从文库中随机挑取19687个克隆,共进行了24304个有效的测序反应(有的克隆片段两端均测序),每个测序反应平均连续阅读480bp,总计测序长度相当于流感嗜 流感嗜血杆菌基因组的测序程序 血杆菌全基因组长度的6.4倍。 鸟枪法组装原核生物的小型基因组序列 上述24304条长度为480bp的DNA连续序列由一台RAM(随机存取存储器)为512M的电脑检索重叠区并据此加以序列组装,耗时30小时,最终得到140个序列重叠群(Sequence contig),它们各自代表流感嗜血 流感嗜血杆菌基因组的测序程序 杆菌基因组上不同的非重叠部分(即相互不贯通): 流感嗜血杆菌基因组 140个序列重叠群 平均170条DNA连续序列 鸟枪法组装原核生物的小型基因组序列 两个相邻序列重叠群之间的序列间隙(Sequence gap)是指存在于基因组文库中但未能被组装的克隆序列。经查,在上述的流感嗜血杆菌基因组文库中共有99个克隆的两端序列横跨两个不同的序列重叠群,它们对贯通 序列间隙非常珍贵。 相邻序列重叠群之间序列间隙的贯通 序列重叠群 M 序列重叠群 N 克隆序列 m1 克隆序列 n1 设计探针 杂交文库 挑选呈双阳性克隆 采用内部引物测序 鸟枪法组装原核生物的小型基因组序列 相邻序列重叠群之 间物理间隙的贯通 流感嗜血杆菌基因组文库形成140个序列重叠群,共有141个间隙,99个序列间隙已经贯通,还有42个物理间隙,即不存在于基因组文库中的遗漏序列。贯通物理间隙的做法是利用噬菌体载体 物理间隙的克隆片段。 基因组文库,然后筛出包含 (装载量为25kb)构建第二 3 B DNA连续序列的组装 a 基于鸟枪法的序列组装 鸟枪法组装真核生物的大型基因组序列 受到流感嗜血杆菌基因组鸟枪法测序获得成功的鼓舞,Craig Venter及其同事又提出了真核生物多染色体的全基因组鸟枪法测序设想。然而,真核生物基因组更大,需要贯通的序列间隙和物理间隙会成倍增加;而且大多数真核生物基因组中还广泛存在着DNA重复序列,后者对DNA连续序列的组装会产生重大影响。因此,与原核细菌基因组序列的鸟枪法组装不同,真核生物大型基因组的组装必须借助于基因组图谱的指导。 3 B DNA连续序列的组装 a 基于鸟枪法的序列组装 鸟枪法组装真核生物的大型基因组序列 参照基因组图谱定位物理间隙 骨架 A 骨架 B 物理间隙 序列间隙 序列重叠群 构建第二基因组文库贯通骨架之间的物理间隙 骨架定位 两个相邻物理间隙之间的若干序列重叠群合称骨架,它们是序列组装的最初结果。首先可参照基因组图谱上的STS标记将骨架和物理间隙 定位在图谱上,然后贯通。 3 B DNA连续序列的组装 a 基于鸟枪法的序列组装 鸟枪法组装真核生物的大型基因组序列 大片段克隆区分重复序列 重复序列 重复序列 重复序列 重复序列 能正确组装 会错误组装 无法组装 含重复序列的DNA片段的组装必须本身长度大于最大的重复序列长度,否则将会发生组装

文档评论(0)

带头大哥 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档