- 1、本文档共43页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
GenBank是具有目录和生物学注释的核酸序列综合数据库, 由美国国家医学图书馆(NLM)的国家生物技术信息中心(NCBI)构建、维护和管理。 该中心位于美国马里兰国家健康研究所(NIH)。 GenBank数据库页面 FASTA格式序列 gi|221078348|gb|EU755370.2| Solanum lycopersicum isolate WRKY1000.3 WRKY mRNA, complete cds ATTTTAAGCTTTTTGGATTTGTTGGAATTTTATTAAGAAGAAATTAAAGCAATGGAATTCACAAGTTTGGTTGATACTTCCTTGGATTTGAGTTTTAGACCTCTTCCAGTTCTTGATAAAGTGCTGAAACAAGAAGTTCAGAGTAATTTCACTGGATTGAGCAGAGACAATATGCTGGTGAAAGATGAGGCAGGTGATTTGTTGGAGGAACTGAACAGAGTGAGCAGTGAAAACAAGAAACTAACAGAGATGCTCACAGTGGTGTGTGAAAATTACAATGCATTAAGAAACCAACTAATGGAGTATATGAACAACCAGAATAATGGTGTAGTAGATGATAGTGCTGGATCAAGGAAAAGAAAAGCTGAAAATATCTCCAATCCCAACAACAACAACAACAACAAAAACAACAACTTGGATATTGTTTGTGGACGTTTATCAGAAAGCAGTTCAAGTGATGAAGAGTCTTGTTGCAAGAAACCTAGAGAAGAGCACATAAAAACTAAGGTTTCTGTCGTTTCTATGAGGACAGAAGCATCTGATACCTCTCTTATTGTAAA /nuccore/221078348?report=fasta Genbank格式 Genbank格式 Genbank格式 Genbank格式 EMBL数据库 DDBJ数据库 非编码RNA数据库(ncRNA) 表达序列标签数据库 dbEST 基因表达数据库(GEO) miRBase 人类基因组数据库(HGD) 拟南芥基因数据库(TAIR) 茄科植物基因组数据库(SGN) 1.7核酸序列数据库---特殊类型核酸序列数据库: 非编码RNA数据库(ncRNA) 非编码RNA(non-coding RNA ncRNA)数据库旨在提供非编码RNA的序列和功能信息。 表达序列标签数据库 dbEST /est dbEST是GenBank中的一个子数据库,包含来源于不同物种的表达序列数据和表达序列标签序列的其他信息。 miRBase miRBase序列数据库主要存放已发表的微小RNA(microRNA miRNA)序列和注释的数据库。 1.8核酸序列数据库---基因表达数据库: 基因表达数据库(GEO) GEO:Gene Expression Omnibus /geo/ 核酸序列数据库---基因组相关数据库: 人类基因组数据库(HGD) /genome/guide/human/ 拟南芥基因数据库(TAIR) 茄科植物基因组数据库(SGN) 蛋白质序列数据库 随着分子生物学的发展,人们获得了越来越多关于蛋白质序列、结构和功能的信息。世界各国的生物学家和计算机科学家合作利用这些信息构建了蛋白质序列数据库、蛋白质三维结构数据库、蛋白质组数据库(二维凝胶电泳数据库)、信号传导及蛋白质-蛋白质相互作用相关数据库、DNA和蛋白质相互作用数据库等蛋白质相关数据库。 蛋白质数据库 综合的蛋白质序列数据库 Swiss-Prot 蛋白质功能、结构域和蛋白质家族有关的数据库 PROSITE、InterPro、Pfam 信号传导数据库 KEGG 三维结构数据库 PDB Pfam 蛋白质一般是由一个或多个功能区域组成,这些功能区域通常称作域(domain)。在不同的蛋白质中不同的域以不同的组合出现,导致在自然界发现多种多样组成成分的蛋白质。识别出现在蛋白质中的域可以了解蛋白质的功能。 Pfam数据库(http://pfam.sanger.ac.uk/)是一个大的蛋白质域家族集合,每个家族是用多序列比对和隐马模型(HMMs)分析结果的代表。 * * * * * * 第4章 DNA、RNA和蛋白质序列数据库 生物信息学数据库 生物信息数据库种类繁多,就目前来看, 大体可以分为四个大类: 1.基因组数据库; 2.核酸和蛋白质一级结构序列数据库;
文档评论(0)