- 1、本文档共4页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
全基因组表达谱分析方法(DGE)----基于新一代测序技术的
技术路线
该方法首先从每个mRNA的3’端酶切得到一段21bp的TAG片段(特异性标记该基因);然后通过高通量测序,得到大量的TAG序列,不同的TAG序列 的数量就代表了相应基因的表达量;通过生物信息学分析得到TAG代表的基因、基因表达水平、以及样品间基因表达差异等信息。技术路线如下:
1、 样品准备:
a) 提供浓度≥300ng/ul、总量≥6ug、OD260/280为1.8~2.2的总RNA样品;
2、 样品制备(见图1-1):
a) 类似SAGE技术,通过特异性酶切的方法从每个mRNA的3’末端得到一段21bp的特异性片段,用来标记该基因,称为TAG;
b) 在TAG片段两端连接上用于测序的接头引物;
3、 上机测序:
a) 通过高通量测序每个样品可以得到至少250万条TAG序列;
4、 基本信息分析:
a) 对原始数据进行基本处理,得到高质量的TAG序列;
b) 通过统计每个TAG序列的数量,得到该TAG标记的基因的表达量;
c) 对TAG进行注释,建立TAG和基因的对应关系;
d) 基因在正义链和反义链上表达量间的关系;
e) 其它统计分析;
5、 高级信息分析:
a) 基因在样品间差异表达分析;
b) 库容量饱和度分析;
c) 其它分析;
测序优势
利用高通量测序进行表达谱研究的优势很明显,具体如下:
1.数字化信号:直接测定每个基因的特异性表达标签序列,通过计数表达标签序列的数目来确定该基因的表达量,大大提高了定量分析的准确度。整体表达差异分布符合正态分布,不会因为不同批次实验引起不必要的误差。
2.可重复性高:不同批次的表达谱度量准确,能够更准确的进行表达差异分析。
3.高灵敏度:对于表达差异不大的基因能够灵敏的检测其表达差异;能够检测出低丰度的表达基因。
4.全基因组分析,高性价比:由于该技术不用事先设计探针,而是直接测序的方式,因此无需了解物种基因信息,可以直接对任何物种进行包括未知基因在内的全基因组表达谱分析,因此性价比很高。
5.高通量测序:已有数据表明,当测序通量达到200万个表达标签时,即可得到样本中接近全部表达基因的表达量数据,而目前每个样本分析可以得到300万~600万个表达标签。
6.无需重复实验。
7.可同时发现新的转录本、基因组表达调控区域等。
8.完整深入的生物信息学分析支持,更有助于进行重要的科学发现,发高质量的文章。
表达谱案例分析
肺癌组织的表达谱分析:选取2个肺癌病人(5T和10T)的组织提取总RNA,进行分析。
实验目的:为了检测两个病人中表达差异较大的基因,以便找出两个病人症状差异的原因,并进行下一步相关的研究。
1、 数据质量的概述
通过严格的质量标准筛选后,通过率达到80%,最终得到500万左右的Tag标签。
2、 标签的初步分析统计
两个样品中有95%的Tag重复频度超过1,73%以上的Tag重复频度超过50。
3、 表达谱测序饱和度分析
通过对表达谱测序饱和度的分析,通常在表达谱Tag数目达到200万时,测序Tag接近饱和。因此,通过Solexa测序,仅需要1次试验,就可以得到足够后续进行表达分析的数据。
4、 样品重复性。
5、 Tag标签的注释(含cDNA,预测基因,EST,线粒体基因组,基因组等)
本案例中,人的2万7千个基因中有50~60%都被Tag所覆盖。即一般的基因的表达量差异被检测出来。为了提高Tag同基因关联的可信度,我们仅仅选取了在基因序列中唯一定位的Tag。这部分唯一定位的Tag占全部Tag数目的50%左右。
另外,除去上述用于基因表达量统计的??一定位Tag,有大约20%的Tag被定位到了基因组的未注释区域,其中大约有10万个Tag在基因组上的位置是唯 一的。利用这些数据我们找到了许多新的转录本和调控区域。同时发现了若干潜在的两个样品间显著差异的区域。为后续的实验提供了可靠的研究目标。
6、 参考Tag标签的统计分析
下表显示的人的参考Tag的统计信息,我们可以看到96.53%的基因都拥有Tag。说明Tag-based 新一代测序技术的方法进行表达谱分析的可行性
7、 基因表达量的分布统计
8、 样本间表达差异基因的相关分析
通过对表达差异基因的统计和分析,我们可以选取样品间表达存在差异的基因,反馈给用户;此外一些已经报道可能相关的基因,是这一部分研究的重点,通过表达差异,我们可以推测出相关基因可能发生的变化。针对此例,图3-3中2个基因是已经报道的在10T样品中高表达的基因。
9、 样本间表达差异基因的信号通路相关分析
对差异表达基因进行功能分析和信号通路分析。结合样本性状差异,鉴定与性状关联的候选基因,以便通过进一步实验验证。
10、 根据Tag距离3’端的位置对tag和基因数目进
文档评论(0)