NCBI 数据库概要1.ppt

  1. 1、本文档共44页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
NCBI 数据库概要1

NCBI站点的一般介绍及其它资源库的介绍 GenBank Overview 生物信息学站点地图 其它资源库的介绍 什么是GenBank? GenBank是一个有13亿碱基,来自于100,000多种生物的核苷酸序列的数据库。每条纪录都有编码区(CDS)特征的注释,还包括氨基酸的翻译。GenBank属于一个序列数据库的国际合作组织,包括EMBL和DDBJ。 纪录样本 关于GenBank的各个字段的详细描述,以及同Entrez有哪些信誉好的足球投注网站字段的交叉索引。 访问GenBank 通过Entrez Nucleotides来查询。 用accession number,作者姓名,物种,基因/蛋白名字,还有许多其他的文本术语来查询。 关于Entrez更多的信息请看下文。 用BLAST来在GenBank和其他数据库中进行序列相似有哪些信誉好的足球投注网站。 用E-mail来访问Entrez和BLAST可以通过Query和BLAST服务器。另外一种选择是可以用FTP下载整个的GenBank和更新数据。 增长统计 参见公布通知的2.2.6(每个分类的统计),2.2.7(每个物种的统计),2.2.8(GenBank增长)小节。 ?公布通知 必威体育精装版 - 最近和即将有的变化,GenBank的分类,数据增长统计,GenBank的引用。 ?旧 - 同上相同,是过去公布的统计。 ?遗传密码 - 15个遗传密码的概要。用来确保GenBank中纪录的编码序列被正确的翻译。 ?向GenBank提交数据 ?关于提交序列数据,收到accession number,和对纪录作更新的一般信息。 BankIt - 用于一条或者少数条提交的基于WWW的提交工具软件。(请在提交前用VecScreen去除载体) ?Sequin 提交软件程序,用于一条或者很多条的提交,长序列,完整基因组,alignments,人群/种系/突变研究的提交。 可以独立使用,或者用基于TCP/IP的“network aware”模式,可以链接到其他NCBI的资源和软件比如Entrez和PowerBLAST。(请在提交前用VecScreen去除载体) ?ESTs - 表达序列标签,短的、单次(测序)阅读的cDNA序列。也包括来自于差异显示和RACE实验的cDNA序列。 GSSs 基因组调查序列,短的、单次(测序)阅读的cDNA序列,exon trap获得的序列,cosmid/BAC/YAC末端,及其他。 ?HTGs - 来自于大规模测序中心的高通量基因组序列,未完成的(阶段0,1,2)和完成的(阶段3)序列。 注意:完成的人类的HTG序列可以同时在GenBank和Human Genome Sequencing页面上访问。 ?STSs 序列标签位点 短的在基因组上可以被唯一操作的序列,用于产生作图位点。 ?注:SNPs - 人类的和其他物种的遗传变异数据可以提交到NCBI数据库的单核苷酸多态性库中(dbSNP)。 国际核苷酸序列数据库合作组织 ?GenBank,DDBJ,EMBL - 合作计划的概述,并链接到相应的主页。 GenBank,DDBJ(DNA Data Bank of Japan),and EMBL (European Molecular Biology Laboratory)数据库共享的数据是每天都交换的,因此他们是相等的。 数据纪录的格式和有哪些信誉好的足球投注网站方式可能会不一样,但是accession number,序列数据和注解都是一模一样的。即,你可以用accession number U12345在GenBank,DDBJ或EMBL中查找相应纪录,得到的结果是完全一样的序列数据,参考内容等等。 ? DDBJ/EMBJ/GenBank特性表 (见讲义) 特性表格式和标准被合作数据库用在序列记录的注释上,使得数据共享成为可能,包括详细的描述生物特性和特性限定语的附录,以及IUPAC规定的核苷酸和氨基酸的代号。 FTP GenBank and Daily Updates GenBank普通文件格式 参见GenBank记录样本和在GenBank公布通知中的详细描述,下载大多数最近的完全公告和日常积累或非积累更新数据。 ?ASN.1格式 — 摘要句法记号1,国际标准组织(ISO)数据表示格式,下载大多数最近的完全公告和日常积累或非积累更新数据。 ?FASTA格式 定义行号后只跟随序列数据(示例),参见描述数据库的readme文件, 包括nt.Z(每天更新的非冗余BLAST核酸数据库, 包括GenBank+EMBL+DDBJ+PDB序列, 不包括EST, STS, GSS, or HTGS序列),nr.Z(每日更新的非冗余蛋白质),est.Z, gss.Z, htg.Z, st

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档