- 1、本文档共91页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
序列数据的文件格式 1. DNA/RNA/氨基酸代码的标识 2. GenBank数据格式 3. UniProt 4. FASTA DNA代码 氨基酸代码 GenBank数据格式 (1) 子库类型 GenInfo Identifier GenBank数据格式 (2) GenBank数据格式 (3) GenBank子库类型 EMBL标识字 GenBank标识字 含义 ID LOCUS 序列名称 DE DEFINITION 序列简单说明 AC ACCESSION 唯一的序列编号 SV VERSION 序列版本号 KW KEYWORDS 与序列相关的关键词 OS SOURCE 序列来源的物种名 OC ORGANISM 序列来源的物种学名和分类学位置 DT 建立日期 RN REFERENCE 相关文献编号或提交注册信息 RA AUTHORS 相关文献作者或提交序列作者 RT TITLE 相关文献题目 RL JOURNAL 相关文献刊物名或作者单位 RX MEDLINE 相关文献Medline引文代码 RC REMARK 相关文献注释 RP 相关文献其它注释 CC COMMENT 关于序列的注释信息 DR 相关数据库交叉引用号 FH FEATURES 序列特征表起始 FT 序列特征表子项 SQ BASE CONTENT 序列长度、碱基数目统计数 空格 ORIGIN 序列 // // 序列结束标志、空行 EMBL和GenBank数据库的行识别标志比较 UniProt数据格式(1) UniProt数据格式(2) UniProt数据格式(3) FASTA格式 关键词 名词、描述性词、词组 序列注册号 (Accession number) 检索体系 Entrez Sequence Retrieval System (SRS) Integrated database retrieval system (DBGET) 如何获得序列数据 在线获取序列( entrez) Entrez是基于Web界面的综合生物信息数据库检索系统。 /entrez 利用Entrez系统,用户不仅可以方便地检索Genbank的核酸数据,还可以检索来自Genbank和其它数据库的蛋白质序列数据、基因组图谱数据、来自分子模型数据库(MMDB)的蛋白质三维结构数据、种群序列数据集、以及由PubMed获得Medline的文献数据。 8大类44个与 Entreze 体系相连的数据库 “Nucleotide Sequences” databases (15) “Protein Sequences” databses (4) “Structures” databases (5) “Genes” databases (4) “Gene Expression” databases (4) “Taxonomy” databases (2) “Genomes” databases (6) “Literature” databases (4) Entrez的特点 Entrez是面向生物学家的数据库查询系统,其特点之一是使用十分方便。它把序列、结构、文献、基因组、系统分类等不同类型的数据库有机的结合在一起,通过超文本链接,用户可以从一个数据库直接转入另外一个数据库 Entrez的另一个特点是把数据库和应用程序结合在一起。例如,通过“Related sequence”工具,可以直接找到与查询所得蛋白质序列同源的其它蛋白质。查询得到的蛋白质三维结构,可以通过在用户计算机上安装的Cn3D软件直接显示分子图形。 Entrez系统的开发基于特殊的数据模型NCBI ANS.1 (Abstract Syntax Notation),在对于文献摘要中的关键字查询时,不仅考虑了查询对象和数据库中单词的实际匹配,而且考虑了意义相近的匹配。在查询文献数据库摘要得到结果后,可以通过点击“Related Articles”继续查找相关文献。 例子:E. coli K-12基因组 以使用Entrez进行查询为例 查询Escherichia coli K12基因组的信息: 向数据库提交和修改核苷酸和蛋白质序列 提交:Submission 修改:Update 数据库中的数据由大家无偿提供,共同享用 /Genbank/index.html Authors Sequin BankIt Sequence data GenBank Accession number 2 days Draft record 序列提交 序列提交工具(sequin) 大量的序列提交可以由Sequin程序完成。Sequin程序能方便的编辑和处理复杂注释,并包含一系列
文档评论(0)