第二章生物数据库介绍讲义.ppt

  1. 1、本文档共49页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二章 生物数据库介绍 生物信息数据库特征 数据库的更新速度不断加快,数据量呈指数增长趋势 数据库使用频率增长更快 数据库的复杂程度不断增加 数据库网络化 面向应用 先进的软硬件配置 分子生物信息数据库分类 序列数据库 核酸序列数据库 蛋白质序列数据库 基因组数据库 结构数据库:主要指蛋白质三维空间结构数据库 功能数据库:主要指蛋白质和核酸功能注释的数据库 由上述3类数据库和文献资料为基础构建的二次数据库 序列数据库来自序列测定,基因组数据库来自基因组作图,结构数据库来自X射线衍射和核磁共振等结构测定。这些数据库是分子生物学的基本数据资源,称为基本数据库、初始数据库,也称一次数据库 一次数据库中的数据直接来源于实验获得的原始数据,只经过简单的归类整理和注释 根据生命科学不同研究领域的实际需要,对基因组图谱、核酸和蛋白质序列、蛋白质结构以及文献等数据进行分析、整理、归纳、注释,构建出具有特殊生物学意义和专门用途数据库称为二次数据库 二次数据库是对原始生物分子数据进行整理、分类的结果,是在一级数据库、实验数据和理论分析的基础上针对特定的应用目标而建立的 一次数据库的数据量大,更新速度快,用户面广,通常需要高性能的计算机服务器、大容量的磁盘空间和专门的数据库管理系统支撑; 二次数据库的容量则小得多,更新速度也不像一次数据库那样快,也可以不用大型商业数据库软件支持,这类针对不同问题开发的二次数据库的最大特点是使用方便,特别适用于计算机使用经验不太丰富的生物学家 序列数据库 核酸序列数据库 国际上权威的核酸序列数据库 欧洲分子生物学实验室的EMBL http://www.embl-heidelberg.de/ 美国生物技术信息中心的GenBank /Web/Genbank/index.html 日本遗传研究所的DDBJ http://www.ddbj.nig.ac.jp/ 目前,这三个数据库已建立数据交换协议,每日同时更新核酸序列资料,对用户而言,在任意一个数据库中查询数据或向任意一个数据库中投送数据基本上是等价的,对于特定的查询,三个数据库的响应结果一样 GenBank 美国核酸数据库 全称:GenBank Genetic Sequence data Bank 美国国立卫生研究院维护的基因序列数据库,汇集并注释了所有公开的核酸序列,由位于马里兰州Bethesda的美国国立卫生研究院下属国立生物技术信息中心建立 从1979年开始建设,1982年正式运行 GenBank数据库包含了所有已知的核酸序列和蛋白质序列,以及与它们相关的文献著作和生物学解释 主要目标:收集世界范围内已发表和自行投送的核苷酸序列以及相关的文献资料,为大规模的核苷酸序列数据建立档案 NCBI:National Center for Biotechnology Information,美国国家生物技术信息中心 为储存和分析分子生物学、生物化学、遗传学知识创建自动化系统; 从事研究基于计算机的信息处理过程的高级方法,用于分析生物学上重要的分子和化合物的结构与功能; 促进生物学研究人员和医护人员应用数据库和软件; 努力协作以获取世界范围内的生物技术信息 NCBI的主要服务功能 PubMed:美国国家图书馆的一项服务,包括1950年以来生物医学所有文献记录,同时提供文献全文相关链接 Entrez:数据库查询和检索系统,提供各种核酸序列、蛋白质序列、基因组数据及各种文献数据库的检索,可设定多种有哪些信誉好的足球投注网站条件,默认方式为“与” BLAST:最基本的局部序列比对排列有哪些信誉好的足球投注网站工具,是常用的序列相似性查询工具,主要包括核酸序列的比对,蛋白质序列的比对等 OMIM:关于人类基因和遗传疾病的分类数据库,收集了已知的人类基因以及由于这些基因突变而导致的遗传疾病 GenBank介绍 是最早的DNA序列数据库,对每个序列,相关数据包括序列名称、序列、位点、关键字、来源、生物种类、参考文献、注释等 最常用的是序列文件,序列文件基本单位为序列条目,包括核苷酸碱基排列顺序和注释两部分 LOCUS:给出序列条目的名称,也称为标识符,包括序列长度,类型等 DEFINITION:给出该序列的功能 ACCESSION :序列编号,具有唯一性和永久性 KEYWORDS :关键字字段,由序列提交这提供,包括序列的基因产物及其他相关信息(如何得到,从何处得到等) REFERENCE:参考文献字段,包括AUTHORS,TITLE,JOURNAL,PUBMED FEATURES:序列特性表,详细描述序列的特性 ORIGIN :碱基序列字段,给出序列中的碱基组成,以//结束 EMBL(The European Molecular Biology Laboratory):欧洲分子生物学实验室 1974年由欧洲14个国家加上亚

文档评论(0)

jiayou10 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8133070117000003

1亿VIP精品文档

相关文档