基因组学理论课 生物信息.pptVIP

  1. 1、本文档共59页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

三常用名词1基因组(genome):生物单倍体染色体的总和(22条常染色体+X,Y,线粒体)。2基因基因(gene):现代遗传学认为,基因是DNA分子上具有遗传效应的特定核苷酸序列的总称。是否一个可遗传的单位(基因)就对应于一个可观察到的表型?编码一个蛋白质或多个蛋白质的遗传信息?基因就是编码RNA的DNA?如果基因没有得到表达是否还能算是基因?而仅有40%的含有内含子/外显子结构的基因得到了正确的预测,不同的方法不能发现的基因的比例在5%~95%之间不等,不正确识别率达55%。基因预测方法脆弱性的最适合的证据也许正是数目的不确定性。3同源性和相似性同源性(homology):如果一些序列来自一个共同的祖先的趋异,它们就是同源的。相似性(analogy):是来自不同祖先而通过趋同进化(convergentevolution)形成的共同结构或功能特征。如可溶性丝氨酸蛋白酶和整合膜孔蛋白都有一些桶状结构,有共同的空间构架,但没有序列和功能的相似性。直向同源物(orthologs):在不同物种中执行同样功能的那些蛋白质如不同细菌中形成鞭毛的基因横向同源物(paralogs):在同一个体内执行不同但是相关功能的蛋白质。如乳酸同功酶基因4结构域和模块蛋白质的结构域(domain)和/或模块(module)的性质:模块是那些经常起到蛋白质构件块功能的自动折叠结构单位(结构域),可以形成同一种模块的多种组合或者不同种模块的镶嵌体(mosaic),通过使用模块来产生不同的功能。如果一项数据库检索的最佳命中物是一个单个结构域或者模块的匹配物的话,那么为查询序列作出功能注释是不大可能的。ASPARTYLGLUCOSAMINIDASE(AGA)α-subunits:Lightred/lightblueβ-subunits:Red/blue5启动子序列启动子(promotor):基因起点的约为13个核苷酸长度的特定核苷酸序列(1个核苷酸是转录起始位点,6个核苷酸位于距起始位点上游10个碱基处,另6个核苷酸位于起始位点上游35个碱基处)。这些核苷酸作为一个整体,称为启动子序列(promotersequences)RNA聚合酶+转录因子+启动子序列结合上目标DNA起始转录6遗传密码密码子在动物(包括人类)、植物、真菌、古细菌、细菌和病毒都具有普遍性,但在线粒体和某些微生物中密码子存在一些小的改变。例如,在一些细菌的基因中,通常的终止密码子UGA编码自然界中发现的第21种氨基酸,即硒代半胱氨酸。在绝大多数生物中作为终止密码子UAG在一些细菌和真核生物中编码在自然界中发现的第22种氨基酸,即吡咯赖氨酸。密码子的简并性(degeneracy):20种氨基酸中18个具有多个密码子这种特性称之。7开放阅读框密码子AUG既可用来编码甲硫氨酸,又可用来标记原核生物和真核生物中RNA分子中准确的翻译起始位置。大多数基因编码的蛋白质长度为几百个氨基酸。在随机产生的序列中终止密码子发生率为1/21(64个密码子中的3个),多数基因的RNA拷贝的阅读框具有长的密码子串,在这个串中没有终止密码子。这一长串未被终止密码子打断的密码子串被称做开放阅读框(openreadingfram,ORF)。大多数真核内含子遵照“GT-AG规则”,即所有内含子DNA序列的头两个核苷酸是GT,而结尾两个核苷酸是AG。ORF预测生物信息学的定义生物信息学的产生生物信息学的科学基础生物信息学的研究内容生物信息学研究的特点生物信息学的研究现状与发展趋势第一节绪论一生物信息学的定义生物信息学(bioinformatics):包含生物信息的获取、处理、贮存、分发、分析和解释的所有方面的一门学科,它综合运用数学、计算机科学和生物学的各种工具进行研究,目的在于了解大量的生物学意义。是把基因组DNA序列信息分析作为源头,找到基因组序列中代表蛋白质和RNA基因的编码区,阐明非编码区的

文档评论(0)

趁早学习 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档