- 1、本文档共32页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
外显子组测序信息分析PPT
外显子组测序在医学研究中的应用一、外显子组测序技术简介 外显子测序是指利用序列捕获技术将全基因组外显子区域DNA捕捉并富集后,再进行高通量测序的基因组分析方法。 外显子组序列仅占全基因组序列的1%左右,与人类85%致病基因突变相关。与全基因组测序相比,外显子组测序不仅费用较低,而且测序覆盖度更深,数据准确性更高。二、外显子组测序流程三、外显子组测序信息分析流程主要信息分析内容归类3.1、数据过滤与评估3.2、整体质量评估3.3、SNP检测与注释3.4、InDel检测与注释3.5、高级分析3.1.1、原始数据过滤过滤接头。对含接头的reads去除接头序列。一条reads上N(未能确定出具体的碱基类型)的比例大于5%,则过滤掉该reads。过滤低质量reads,过滤掉Q3085% reads。3.1.2、测序数据统计与评估测序质量值分布图碱基含量分布图3.2、整体测序质量评估3.2.1、测序深度统计注:横坐标代表测序深度,纵坐标代表目标区域上对应深度的碱基数占总碱基数的百分比。目标区域的单碱基分布近似服从泊松分布。3.2.2、外显子捕获统计Target region statX1X2X3X4Length_of_target_region(Mb)1118.70118.70118.70118.70Reads_mapping_ref(single reads)2182.95168.4897.7696.16Mapping_datasize(Mb)3137211263697769616Effective_sequences_on_target(Mb)592.0590.8666.8464.37Average_sequencing_depth_on_target747.3146.7543.0541.45Mismatch_rate_in_target_region8Mismatch_rate_in_all_effective_sequence9Base_covered_on_target(Mb)106904681566846437Coverage_of_target_region11Fraction_of_target_covered_with_at_least_20x12Fraction_of_target_covered_with_at_least_10x13Fraction_of_target_covered_with_at_least_4x14 当比对到参考基因组目标区域的数据量在60%之上,认为外显子捕获效率合格。3.2.3、染色体覆盖深度分布注:横坐标为染色体长度,纵坐标为覆盖深度取对数。3.3、 SNP检测及注释3.3.1、 SNP检测SNP的检测主要使用GATK软件工具包实现。BMK IDSNP NumberTransition NumberTransversion NumberTi/Tv RatioHeterozygosity NumberHomozygosity NumberX19852546691723160822.11207400777854X28425165733992691172.13167179675337X3263326178220851062.0926436236890X4289954196145938092.0930446259508Tota3.2、 SNP注释TypeR01R02R03R04INTERGENIC449352380794113110125682INTRAGENIC34252896892975INTRON401739343966111218121865UPSTREAM244522135061056521DOWNSTREAM95551835652773230377UTR_3_PRIME395407112124UTR_5_PRIME21651891776850SPLICE_SITE_ACCEPTOPLICE_SITE_DONODSNON_SYNONYMOUS_CODING19711899882925NON_SYNONYMOUS_START2100START_GAINED37834693100START_LOST8632STOP_GAINED2624108STOP_LOST5310SYNONYMOUS_CODING17721732923940SYNONYMOUS_STOP1100Other1068932183.3.3、突变特征突变频谱图注:横坐标为不同类型的突变,纵坐标为不同类型突变对应的频率。3.3.3、突变特征突变位点上下文碱基偏好性注:横坐标为突变位点上下文的碱基位置,0为SNP突变位点,负数代表突变位点前的碱基,正数代表突变位点后的碱基
文档评论(0)