- 1、本文档共27页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
NGS的这10年
【Nature综述】NGS的这10年介绍自从DNA的双螺旋结构被人们解析开始,人们在探究健康与疾病的基因组的复杂性与差异性上做出了巨大的努力。为了支持人类基因组计划的顺利进行,人们在仪器和试剂上做出了巨大的改进。该计划的完成使得人们强烈的意识到人们需要更多更好的技术与数据分析能力来回答随之而来的一系列生物学问题。然而,通量的限制以及居高不下的测序成本成为了人们进一步了解基因组的一道坎。2000年之后推出的高通量测序平台很好地解决了这个问题,人类基因组测序的成本直接因此下降50000倍,并且由此产生了一个新的名词:下一代测序(next-generation sequencing,NGS)。在过去的十年中,NGS技术不停的在进步——测序的数据量增加了100-1000倍。这些技术上的进展使得人们甚至可以在一条read上读出整条基因组序列。根据Veritas Genomics的数据,人类基因组测序的成本也已经下降到1000美元/人。不仅如此,该技术已经广泛在临床诊断上得到应用。但是,尽管NGS技术非常重要,却并非完美。与NGS技术一道出现的是该技术带来的一系列问题。NGS可以提供海量的数据量,但是其质量却有待提高(有报道,NGS在序列拼接过程中,错误率在0.1-15%范围内),并且NGS的序列读长普遍较低(每条read的长度在35-700bp之内,这比普通的Sanger测序要短),这意味着需要更严格复杂的序列拼接。尽管长读长测序可以克服NGS的这一大弱点,但相对而言,成本较高并且通量较低,这也限制了该技术的进一步应用。最后,NGS同时还和其他的技术之间存在着竞争的关系。短读长(read)的NGS测序测序模版克隆法生成综述短读长测序方法包含两种:边连接边测序(sequencing by ligation, SBL)以及边合成边测序(sequencing by synthesis, SBS)。在SBL方法中,带有荧光基团的探针与DNA片段杂交并且与临近的寡核糖核酸连接从而得以成像。人们通过荧光基团的发射波长来判断碱基或者其互补碱基的序列。SBS方法通常使用聚合酶,而且,诸如荧光基团在链的延伸过程中被插入其中。绝大多数的SBL和SBS方法,DNA都是在一个固体的表面上被克隆。一个特定区域内成千上万个拷贝的DNA分子可以增加信号和背景信号的区分度。大量的平行同样对上百万的reads的读取大有帮助,每个平行只有唯一的DNA模板。一个测序平台可以同时从上百万的类似反应中读取数据,因此可以同时对上百万的DNA分子进行测序。产生模板的克隆有几个方法:基于磁珠(bead-based),固相介质(solid-state)以及DNA微球技术(DNA nanoball)(图1)。DNA模板产生的第一步就是样本DNA的片段化,接着是连接到一个为了克隆和测序而设计的接头上。在磁珠法的准备过程中,一个接头和寡核糖核酸片段互补并且固定在珠子上(图1a)。DNA模板通过使用油包水PCR(emulsion PCR,emPCR)得以扩增。单个珠子上被克隆得到的DNA片段可以达到上百万个。这些珠子可以被分为glass surface或者PicoTiterPlate(罗氏诊断)。固相介质扩增避免了油包水PCR,取而代之的是在固相介质上直接进行PCR(图1b,c)。该方法中,正向和反向引物结合在芯片的表面,这些引物给单链DNA(single-stranded DNA,ssDNA)提供了末端的互补序列供其结合。最近,几个NGS的平台都是用了模块化的flow cells。BGI使用的Complete Genomics technology测序技术是唯一一个在溶液中完成模板富集的技术。在这种情况下,DNA被多次连接,成环以及剪切从而为了产生一个包含4个不同接头的环状的模板。通过旋转环状扩增(rolling circle amplification,RCA),可以最多产生超过200亿的DNA微球(图1d)。微球混合物随后被分配到芯片表面上,使得每个微球可以占据芯片的一个位点。图1:模板扩增策略。边连接边测序(SOLiD和Complete Genomics)从根本上来说,SBL法包含了杂交和对标记的探针的连接。探针包含了一到两个特定碱基序列和一系列通用序列,这可以使得探针与模板之间进行互补配对。锚定的片段则包含一段已知的和接头互补的序列用于提供连接位点。连接之后,模板被系统进行测序反应。在锚和探针复合物或者荧光基团被完全移除之后,也或者连接位点重新生成之后,新的循环又重新开始了。SOLiD平台使用的是双碱基编码的探针,每个荧光基团信号代表了一个二核糖核酸。因此,原始输出的数据并非直接和已知的核糖核酸相连。因为有16种可能的二核糖核酸组合并不能单独结合荧光基团。每四种组合使用一种荧光信号,
文档评论(0)