2数据库介绍【荐】.ppt

  1. 1、本文档共50页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2数据库介绍【荐】.ppt

a b c a b c d Phase 0 Phase 1 Phase 2 Phase 3 cosmid / BAC / YAC (7)基因组数据库 /entrez/query.fcgi?db=Genome NCBI 的另一个数据库 测序完成和正在测序物种基因组序列、遗传图、物理图等 序列收集在GenBank 已经完成测序的基因组(截止2010年4月) 古细菌(archaea)染色体(166) 细菌(bacteria)染色体(3170) 真核生物(eukaryota)染色体(3497) 病毒(viruses)(2983) 噬菌体(phages)(578) 类病毒(viroids)(40) (7)基因组数据库 /entrez/query.fcgi?db=Genome 真核生物器官(organelles) 线粒体(mitochondria)(2152) 质体(plastids)(177) 质粒(plasmids)(19) 类核体(nucleomorph)(8) 所有质粒(all plasmids)(2258) 数据形式丰富 8)dbSNP (Database of Single Nucleotide Polymorphisms) /SNP/ NCBI的数据库,创建于1998.9 约每100-300 bp 有一个SNP 数据种类 Single nucleotide polymorphism(SNP) Short deletion Insertion polymorphism Insertion/deletion (Indel) Deletion/insertion/substitution (DIS) 代码 碱基 互补代码 M A或C K R A或G Y W A或T W S C或G S Y C或T R K G或T M V A、C或G B H A、C或T D D A、G或T H B C、G或T V N G、A、T或C N dbSNP主页输入关键词 检索到的条目 每一条目详细内容 标准碱基多意代码 tyrosine kinase为例 (9)EMBL (European Molecular Biology Laboratory) Nucleotide Sequence Database EBI (European Bioinformatics Institute) 管理 主要是欧洲国家产生的 DNA 和 RNA 序列 序列数据文档格式与 GenBank 不同 数据库主页http://www.ebi.ac.uk输入关键词 检索到的条目 每一条目详细内容 (10)DDBJ (DNA Data Bank of Japan) 主要是日本产生的 DNA 和 RNA 序列 数据库主页http://www.ddbj.nig.ac.jp/intro-e.html输入关键词 发表文章要提供 Accession number 检索到的条目 每一条目详细内容 11)EPD (Eukaryotic Promoter Database) http://www.epd.isb-sib.ch 由Weizmann Institute of Science in Rehovot (Israel) 开创 4809条真核生物聚合酶II(eukaryotic POL II)启动子序列(2009.6) 收集数据的转录起始位点通过实验确定 cis-element信息 人类基因组中的启动子大约19万个 同一个基因具有多个启动子 (11)miRBase (the home of microRNA data) / 收集了10883条 hairpin precursor miRNA 序列(2012.8) 表达21264条mature miRNA 来源于115个物种 可以通过miRNA名、关键词、染色体位置等检索数据库 分析一条DNA序列中是否可能包含miRNA(第四章介绍) 作业 写出生物信息学定义,英文名称。 写出GenBank,EMBL,DDBJ 网址。 何谓一级结构序列数据库和二次数据库? 什么是EST,STS,UniGene? 什么是FASTA序列格式? * * * 第三章 生物信息数据库 主要内容: 初级数据库:包括DNA数据库、基因组数据库 蛋白质序列数据库和蛋白结构数据库 初级数据库的注释 数据库的冗余和偏差 向数据库发送序列数据 数据库信息检索系统 序列数据库 结构数据库

文档评论(0)

cnsg + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档