- 1、本文档共120页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
主要存在两种假基因: ① 常规假基因:指基因的核苷酸序列因为突变而发生改变,导致基因失活。 ② 已加工的假基因:不是因为进化学上的衰退引起,而是因为基因表达的异常修饰所致已加工的假基因,是指以某个基因mRNA拷贝合成的cDNA拷贝,再次插入到基因组以后形成的。。 已加工假基因的来源 mRNA先被逆转录成cDNA拷贝,而后者可能整合到母体基因所在的染色体中,或整合到其他染色体中。 已加工假基因是mRNA分子的拷贝,所以其中没有母体基因的内含子。它还缺少母体基因的立即上游序列,导致了已加工假基因的失活。 除假基因外,基因组还包括了其他的进化遗迹,包括截短基因(truncated gene),这些基因与完整的基因组相比,或多或少的缺失了部分序列,以及基因片段(gene fragment),这些基因片段是指从某个基因内部被分割出来的短的区域。 截短基因和基因片段 7.2.4 真核生物核基因组中的重复DNA序列 人类基因组测序发现,约62%的基因组由基因间隔区组成。这些序列以前被称为垃圾DNA,但这个术语渐渐被舍弃。 大量的基因间隔区是由某种重复序列组成。重复性DNA可分为两类:全基因组范围或散步重复以及串联重复DNA。 两种类型的重复性DNA:散步重复和串联重复DNA 1. 串联重复DNA可见于真核生物染色体着丝粒及其他位置 串联重复DNA也叫卫星DNA(satellite DNA),因为在用密度梯度离心法分离基因组DNA时,含有串联重复序列的DNA片段形成卫星带。 人类基因组卫星DNA 人DNA的平均GC含量为40.3%,平均浮力密度为1.701,主要由单拷贝DNA组成的片段,其GC含量接近平均值,位于主带中。卫星带浮力密度为1.678、1.693和1.697,由重复DNA的长段组成。这些片段GC含量取决于各自重复模体的序列,与基因组的平均值不同,由此,这些片段与单拷贝DNA的浮力密度不同,在密度梯度离心时会移动到不同的部位。 卫星DNA可能长达几百kb。一个基因组中可能存在几个不同类型的卫星DNA,各自有不同的重复单元。人3个卫星带包括了至少4种不同的重复类型。 虽然一些卫星DNA散布于整个基因组,但大多位于着丝粒,它们可能作为一种或多种特殊着丝粒蛋白的结合位点而发挥结构性作用。 2. 小卫星和微卫星 虽然没出现在密度梯度的卫星带中,另外两种串联重复DNA序列也可以归为卫星DNA,它们是小卫星和微卫星。 小卫星形成长达20kb的聚集区,每个重复单位最多25bp。微卫星区较短,通常小于150bp,其重复单位只有13bp或更少。 ② 酵母中不连续的基因数目相对较少。在此片段中,无内含子。在整个酵母基因组中,只有239个内含子,相比之下,人基因组中含有300000个以上。 ③ 全基因组范围的重复序列更少。这部分片段只包括一个LTR元件及4个截短的LTR元件。酵母全基因组范围的重复序列只占总序列的3.4%。 该比较提示,酵母的基因组在基因的编排方面比人更经济。酵母基因自身更加紧密,内含子更少,基因间的空隙也相对更短,全基因组范围的重复序列和其他非编码序列占用的空间更少。 3. 其他真核生物中的基因编排 在观察和比较其他物种的基因组时,建立了这样一个假设:越是复杂的真核生物,它们的基因组越不紧凑。 酵母、果蝇和人基因组的紧凑性 从全基因组范围的重复序列的角度考虑时,这些序列占酵母基因组的3.4%,占果蝇基因组的12%,占人基因组的44%。全基因组范围的重复序列在提示某个基因组紧凑与否中起到了很明显的作用。 这在玉米基因组中得到了充分的说明。玉米基因组只有2500Mb,在开花植物中算是相对较小的。全基因组范围的重复序列约占玉米基因组的50%之多。 人、酵母、果蝇和玉米的基因组比较 7.2.3 基因组中有多少基因? 目前认为人基因组中包含30000-40000个基因,之所以未能给出精确的数目,是因为在区分哪些序列是基因哪些不是时存在很大的困难。 这个基因数比人们远来预期的要少很多。在2000年草图完成前,流行的是80000-100000个基因。 这些早期的估计之所以偏高,是因为人们的预计是依据一个假设:单个基因需要对应于单个mRNA和单个蛋白质。 实际基因数偏少的发现,揭示了选择性剪切的存在,从而导致了单个基因可以产生一个以上的蛋白质。 选择性剪接 选择性剪接产生不同的外显子连接组合,导致由同一个前体mRNA合成出不同的蛋白质 不同真核生物的基因组大小和基因数目 由于选择性剪切的存在,有多少基因这个问题并没有真正的生物学意义,因为基因数目并不能代表被合成出的蛋白质数量。 1. 人类基因目录 在人30000-40000个基因中,约半数基因的功能是已知的或在某种程度上得到明确提示的。 其中绝大多数是蛋白质编码基因;只有不到2500个基因是编码不同类
文档评论(0)