[生物学]GA数据流程.ppt

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[生物学]GA数据流程

GA数据处理流程 Hiseq数据处理流程 GAHIseq数据处理输出文件 fastq文件 @Reads ID 碱基序列 + 碱基质量 4行表示一条reads @FC617B0AAXX:3:17:1052:2159#0/1 AAATTGTGGGGAGCAAGGCCTCTGAATTGGCTAAAAC + bbbbbbbbbbb\b]bbaababb``b^]]^]_b`bbbb @FC617B0AAXX:3:17:1053:18233#0/1 TTTTAAAGGAGCATGAGAAAACTTTTGAGGTGATAGC + _Ya`a`[^a```^T^^^X[WX^^V```VY^HWJVV`^ @FC617B0AAXX:3:17:1053:16055#0/1 CGCATGGTAAAATATCAAAAGTCTAAGCAAATAGTCT + ^`^`]XZ__MNNNNN``__[`````U`]V_BBBBBBB GAHIseq数据处理输出文件 fastq文件 Single-end测序,每个样品只有1个fastq文件 Pair-end测序,Read1有1个fastq文件,Read2有1个fastq文件 Reads ID @ [FC编号] : [Lane编号] : [Tile编号] : [X坐标] : [Y坐标] # [index序列] #0表示非index测序 /1 表示Read1 /2 表示Read2 @FC617B0AAXX:3:17:1053:16055#0/1 @FC617B0AAXX:3:17:1053:16055#0/2 @FC61FL8AAXX:1:17:1013:17324#GCCAAT/1 @FC61FL8AAXX:1:17:1013:17324#GCCAAT/2 GAHIseq数据处理输出文件 fastq文件 碱基序列——用A, C, G, T, N表示 Read1的reads和Read2的reads一一对应 Read1中reads的数量 = Read2中reads的数量 Read1的fastq文件 *1.fq中第一条reads: @FC61FL8AAXX:1:17:1012:19200#GCCAAT/1 CCACTGTCATGTGAACATCACAGAGACATTTCTTGA + bbbbbbbbbbabbbbbbbbbbbbbbaaaaaaaaa_\ Read2的fastq文件 *2.fq中第一条reads: @FC61FL8AAXX:1:17:1012:19200#GCCAAT/2 AAAATTAGCCAGGCAATGGTGGTGCATGCCTTTAATCCCAGCTA + `QVVV``V``````YVYWWYPWYYTYYWUYYYVV```````WW` GAHIseq数据处理输出文件 fastq文件 碱基序列 Read1中所有reads长度相同, Read2中所有reads长度相同, 但是Read1和Read2长度可以不相同,取决于上机测序类型 每个Lane的正常产量范围: GA 25~30M reads — Read1和Read2各有25~30M Hiseq约50~60M reads — Read1和Read2各有50~60M 碱基总产量 = Read1的产量 + Read2的产量 = reads数量*(Read1的长度 + Read2的长度) GAHIseq数据处理输出文件 fastq文件 质量值 @FC61FL8AAXX:1:17:1012:19200#GCCAAT/1 CCACTGTCATGTGAACATCACAGAGACATTTCTTGA + bbbbbbbbbbabbbbbbbbbbbbbbaaaaaaaaa_\ 表示方法 Illumina:字符的ASCII值 - 64 = 质量值 ( Sanger:字符的ASCII值 - 33 = 质量值) 范围 Illumina1.3+(09年3月之后): [2,35] [B,c] Illumina1.0 (09年3月之前): [-5,40] [;,h] 质量值与错误率理论关系: Q =-10 log10(e) 质量值计算方法:根据光强信号信噪比、光强度衰减、GC含量等参数,计算质量值 问题1:Pair-end关系 200~800bp文库 PCR free 文库 文库制备完成后 Cluster制备完成后 Read1测序 Read1测序 Read2之前的Cluster扩增,保留原母版分子的反向互补 Read2测序 文库分子与测序得到的序列 参考序列与测序得到的序列 或者: 总之,Read1,Read

文档评论(0)

skvdnd51 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档