网站大量收购闲置独家精品文档,联系QQ:2885784924

生物信息学中基因数据库的发展.pptx

  1. 1、本文档共60页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
生物信息学中基因数据库的发展要点

;;;;;;;;基因数据库的发展历史;基因组数据库的发展历史;GenBank数据库的发展历史;;NCBI’s Genbank (1982-);;EBI’s EMBL (1982-);NIG’s DDBJ (1987-);;;认识GenBank文件格式(头部);认识GenBank文件格式(特性表);认识GenBank文件格式(序列);;三大基因数据库;主要的数据库资源;1.2 NCBI上常用的生物学资源 ;; Entrez由美国NCBI开发,用于对文献摘要、序列、结构和基因组等数据库进行关键词查询,找出相关的一个或几个数据库条目。该系统目前主要包括核酸序列数据库、蛋白质序列数据库、基因组数据库、蛋白质结构数据库、生物医学文献摘要数据库、系统分类数据库、人类遗传疾病和遗传缺失在线数据库,以及基因信息数据库、种群亲缘关系核酸序列比对数据库、表达序列标签数据库等。; Entrez 是由NCBI主持的一个数据库检索系统,它包括核酸,蛋白以及Medline文摘数据库,在这三个数据库中建立了非常完善的联系。 因此,可以从一个DNA序列查询到蛋白产物以及相关文献,而且,每个条目均有一个类邻(neighboring)信息,给出与查询条目接近的信息。 ;  Entrez中核酸数据库为:GenBank, EMBL, DDBJ  蛋白质数据库为:Swiss-Prot, PIR, PFR, PDB  PubMed  基因组和染色体图谱资料;检索领域:(Search Fields);修改日期(Modification Date): 包含该条目进入Entrez的日期, 与出版日期一 样,以年/月/日形式出现 页数(Page Number): 该文章所在杂志的页码 特性(Property): 一个或几个关键词,用来描述该序列的类型 出版日期(Publication Date):包含文章出版日期以及序列录入GenBank的日期 PubMed ID: PubMed对每一个条目给出的识别标记 物种(Organism): 包含与该蛋白或核酸序列相关物种的学名和俗名 蛋白质名称(Protein name): Seq Id: 与FASTA识别标记类似,为序列的一种识别标记 物质(Substance): 与该条目相关的化学物质名称;文字检索词(Text Words):包含文章中的所有词,其中: Medline词目:标题和文摘 蛋白质词目: 定义,评论,蛋白名称,蛋白描述 核酸条目: 定义,评论,基因名称,基因名称 标题检索词(Title Words): 在标题中出现的词,或在描述该条目时出现的词 卷(Volume): 刊登该文章杂志所在卷 使用Medline UID, PubMed ID和 Seq ID进行检索时,在栏目框中要输入数字。如要输入多个数字,中间要用空格或逗号隔开。并选择相对应的检索领域; www Entrez可以采用几种不同途径的检索方式:   名词列表格式(list term):当输入一检索词后,Entrez将列出与此相关的该领域中所有标准的检索词名称, 此时,可选择一或多个标准名词去检索。   自动格式(automatic):当输入一个检索词后,即自动检索,如果输入的检索词超过一个,则Entrez会自动将之组合起来, 如果无结果,则可尝试将这多个检索词用“ ”括起来。;  每一个文件都可以有数种阅读方式,目的各不相同。一般来说,“引文格式(citation)”最适合于阅读Medline形式的文件;“GenPept” 格式适用于阅读蛋白质文件;“GenBank”格式用来阅读核酸文件。;文字检索词(Text Words):包含文章中的所有词,其中: Medline词目:标题和文摘 蛋白质词目: 定义,评论,蛋白名称,蛋白描述 核酸条目: 定义,评论,基因名称,基因名称 标题检索词(Title Words): 在标题中出现的词,或在描述该条目时出现的词 卷(Volume): 刊登该文章杂志所在卷 使用Medline UID, PubMed ID和 Seq ID进行检索时,在栏目框中要输入数字。如要输入多个数字,中间要用空格或逗号隔开。并选择相对应的检索领域;  每一个文件都可以有数种阅读方式,目的各不相同。一般来说,“引文格式(citation)”最适合于阅读Medline形式的文件;“GenPept” 格式适用于阅读蛋白质文件;“GenBank”格式用来阅读核酸文件。;1.2 NCBI上常用的生物学资源 ;4、数据库技术及数据挖掘;;;现状及问题;;;human;;;;;Major Application I:Designing Drugs;Major Application II: Fin

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档