16S rDNA测序常见知识点补充 _ 16S专题.docxVIP

16S rDNA测序常见知识点补充 _ 16S专题.docx

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
16S rDNA测序常见知识点补充 | 16S专题 编前语 在分享之前,我想先对前两期留言肯定16S专题的小伙伴们说声谢谢,我是一名生信工程师,平时做项目和自我学习占据了我大部分的时间,这个专题是我挤出业余时间写的,但你们的肯定、鼓励与支持是我继续写下去、并追求写得更好的动力,谢谢你们! 1、16S rRNA vs 16S rDNA 16S rRNA是细菌核糖体30S小亚基的组成部分。 16S rDNA是细菌上编码rRNA相对应的DNA序列。 常见相关文献中存在16S rRNA基因测序和16S rDNA测序两种说法,实际上这两种说法可以看作等同。 2、测序深度、覆盖深度 测序深度指的是测序得到的总碱基数与待测基因组大小的比值,若某物种的基因组大小为 覆盖深度是指测序获得的序列占整个基因组的比例。理想情况下,物种基因组大小有多大与测序得到的序列量是吻合的,然而由于基因组中存在高GC、重复序列等复杂结构,导致测序拼接组装的到的序列往往不能覆盖基因组的所有区域。例如,某个细菌基因组测序覆盖深度为99%,则该细菌还有1%的序列不在测序所得序列之内。 3、引物(primer)、接头(barcode) 引物(primer):是人工合成的一小段DNA或RNA序列,作为DNA复制的起始点。16S测序中目的片段的引物是基于保守区的序列设计的,为了解决碱基多态性的问题,尽量选择覆盖率高的引物。 接头(barcode):一种标签序列,也是人工设计的,有了它,在生信分析步骤中,便能将不同样品的序列从测序所得的所有序列中辨别出来。 4、接头(barcode)选择原则是什么 接头的选择主要是要兼顾碱基平衡和激光平衡,相当于ATCG四种碱基尽量都存在,且ATCG的比例接近一致,A+C=G+T。 5、16S扩增子建库原理 16S扩增子建库实质就是利用酶和引物对特定片段进行PCR富集和筛选。这种建库方法,相对机器打断法等方法来说成本较低。 6、OTU是什么 OTU是一种操作分类单元。这种操作分类单元是通过特定的距离度量算法计算两两不同序列之间的距离度量或相似性,然后设置一定的分类阈值,得到同一阈值下的距离矩阵,进行聚类操作,从而形成的分类单元。简单的说,就是相似性为97%的reads被归为同一类别的核苷酸序列。 7、为什么要进行样品OTU抽平? 在对原始数据进行质控处理时,去掉了一部分不合格的序列,对样品OUT抽平是为了让各样品的序列数保持一致,便于在同一标准上对各样品进行Alpha多样性分析等,保证有可比性。 8、样品序列,在与数据库比对时,如何挑选每个OTU的代表序列? 每个OTU往往有多种reads,每种reads条数不同,在进行数据库比对时,选取reads条数最多的核苷酸序列作为代表序列。 9、Q20、Q30 在理解Q20、Q30之前,我们先来理解碱基质量值(Q)的概念。二代测序,每个测序后的碱基都有一个质量值,这个质量值反映了测序的准确度情况。 行业中Q20(Q30)指的是测序序列中质量值大于或等于20(30)的碱基所占百分比,主要作用是评估序列测序的准确度。Q20(Q30)表示碱基被测错的概率为1%(0.1%),准确率为99%(99.9%)。一般来说,准确度达到Q30的碱基量至少要为85%。 10、Contig N50 vs Scaffold N50 Contig N50为评估拼接reads效果的指标, Scaffold N50为评估组装contig成Scaffold时的组装效果指标 11、技术重复VS生物学重复、样本测序量(总数据量不变、生物学重复数与单样本测序量最佳组合) 技术重复指的是同一样品多次测量。 生物学重复指的是经过相同方式处理的相同样品。生物学重复数量原则上越多测序结果越准确,但在实际的研究中,或由于科研经费有限亦或是由于生物学重复难度大,也常常会采取生物学重复数与单样本测序量合理搭配的做法,从而保证研究结果准确性。 12、常见实验样本取样指南 土壤样本取样:选择具有代表性的土壤,使用无菌工具,采集5-10cm深的一定量的土壤,去除杂质,分装标记,每袋样品约5-10g,密封后立即低温保存。 粪便样本取样:用无菌粪便采集器或其它灭菌器皿收集粪便样品,分装标记并立即低温保存(也可先标记并低温保存后分装)。每个样本分装几管灭菌离心管,每管0.2g左右。小鼠个体较小,粪便不足0.2g时可将生物学重复样本混合。注意粪便样品不要在空气中暴露太长时间,避免污染和降解。对于珍贵和较难收集的样品,建议老师们进行备份。 13、16S测序物种注释常用数据库及其特点 RDP(?/seqmatch/seqmatch_intro.jsp) RDP数据库全称“RibosomalDatabaseProject”,该数据库提供质控、比对、注释的细菌、古菌16SrRN

文档评论(0)

stereo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档