- 1、本文档共8页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
TheTeaTreeGenomeProvidesInsightsintoTeaFlavorandIndependentEvolutionofCaffeineBiosynthesis
茶是世界上最古老,最受欢迎的含咖啡因的饮料,具有极大的经济,药用和文化价值。栽培茶树山茶的重复序列高达80.9%,基因组大小3.02Gb。文章发现,由于几个LTR反转录转座子家族的缓慢,稳定和长期的扩增,导致茶树异常大的基因组。除了最近的全基因重复事件之外,还发现了与类黄酮生物合成相关的基因特异性扩增,其增强了儿茶素生产,萜烯酶活化和胁迫耐受性,茶叶风味和适应性的重要特征。相对于可可和咖啡,我们发现茶咖啡因合成途径的独立快速演变。其中通过25个茶树品种比较发现,大多数类黄酮和咖啡因相关基因的表达水平越高越有助于提高生产儿茶素和咖啡因,从而提高茶叶加工适制性和茶叶品质。这些新颖的研究结果为进一步通过代谢组和功能基因组修饰研究铺平了道路,并将有助于开发更多风味的茶,最终将在全世界满足和吸引更多的茶饮者。
前言
茶叶是世界160多个国家超过30亿人所喜爱和消费的,是世界上最古老的(公
元前3000年)和最受欢迎的非酒精含咖啡因饮料。除了有吸引力的香气和宜人的口味之外,由于茶叶中许多特征性的次生代谢产物,如多酚,咖啡因,茶氨酸,维生素,多糖,挥发性油和矿物质,因此山茶都具有许多健康和药用的功效。茶树是商业化种植茶叶的来源,属于茶属。其中还包含了其他几个重要经济价值的物种,比如花较为好看的山茶,产生高品质的食用籽油的油茶。茶叶作为药用饮料的第一个可信记录是在中国商代期间,可追溯到公元三世纪。茶的全球扩张较为复杂和冗长,它在跨越千年历史和多个文化,并在全球扩张到100多个国家。今天,茶叶在全球范围内超过380万公顷的土地上种植商业化,2014年每年生产茶叶565万吨。
作为世界上最受欢迎的饮料之一,茶具有来自三种主要特征次级代谢物:儿茶素,茶氨酸和咖啡因的良好营养和药物性质。这些植物化学化合物,特别是儿茶素,对人类健康有益,其含量和组分比例大部分决定了茶的风味。山茶属有具有不同代谢特征的~119种物种。为解释和确定茶加工适宜性的类黄酮,茶氨酸和咖啡因生物合成途径的变异和进化提供了独特的强大系统。数以千计的大陆引进和常规的选择性育种工作已经导致了大量的种族和精英品种,适应全球多样化的栖息
地,从而确保了全世界不同的茶叶生产力和质量。茶树中丰富的代谢物成分可能
地,从而确保了全世界不同的茶叶生产力和质量。茶树中丰富的代谢物成分可能
对适应地球上不同生态位的重要作用。揭开这些全球适应的基因组依然是一个未解之谜。虽然众所周知,茶叶中三种主要特征成分的差异积累主要决定了茶叶的质量,但目前关于儿茶素,茶氨酸和咖啡因代谢途径的复合转录调控的基因组信
息很少。
这里,我们研究了云抗10号(2N=2×=30条染色体),一个二倍体栽培品种的
高品质的基因组装。其广泛生长在中国西南的基础上。通过连同代表性茶树种类的比较转录组学和植物化学分析,我们旨在获得对三种特征次级代谢物生物合成
的分子基础的新见解,重点是茶加工的适用性和茶味的形成。
结果
基因组测序,组装和注释
我们对中国云南省的茶树基因组(品种云抗10号)进行了测序。利用Illumina
下一代测序平台(HiSeq2000)进行了全基因组鸟枪法测序分析。这产生了
~707.88Gb的原始序列数据集,从而产生高达159.43倍的高质量序列覆盖。使用两种正交方法,我们估计云抗10号的基因组大小在2.9到3.1Gb之间。使用Platanus(适用于高杂合和高重复基因组)组装茶树基因组,然后使用SSPACE搭建scaffold。这最终产生了~3.02-Gb基因组装置,其跨越估计的基因组大小的约98%,并且包含37618个scaffolds(N50=449kb)和258790个contig(N50
=20.0kb)。为了验证基因组组装质量,我们先从公共数据库中对所有可用的DNA
为了进一步帮助基因组注释,我们测了总共八个文库代表主要组织类型和发育阶段的RNA测序(RNA-seq)数据,其中包括年轻叶,嫩枝,花芽,花,茎,根,种子和幼苗。利用组合从头、同源和转录组一起进行基因预测,并进一步过滤,我们得到了36951蛋白质编码基因。其中,33415(?90.43%)和
为了进一步帮助基因组注释,我们测了总共八个文库代表主要组织类型和发育阶段的RNA测序(RNA-seq)数据,其中包括年轻叶,嫩枝,花芽,花,茎,根,种子和幼苗。利用组合从头、同源和转录组一起
文档评论(0)