- 1、本文档共48页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
01_简介_02_数据库检索_2013-2讲述
2.3 基因组数据库 收集并贮存各种生物完整基因组染色体的DNA序列、结构及功能注释的数据库。 主要包括NCBI的Genome数据库,EBI的Genome Reviews数据库以及加利福尼亚大学圣克鲁斯分校的UCSC基因组数据库。 2.3.1 NCBI的基因组数据库 /genome 该数据库目前已收集了6000种以上物种的基因组的完整染色体序列图谱、遗传图谱和物理图谱,分为古生物、细胞、真核生物、病毒、类病毒和质粒六大类群。 2.3.2 EBI的基因组浏览数据库 2.3.3 UCSC基因组浏览器 点击“Genomes”,进入“定位”检索方式。 点击“Blat”,进入“序列比对”检索方式。 点击“Tables”,进入“表单”检索方式。 “表单”检索的参数选择: clade —— 进化分支; genome —— 物种; assembly —— 版本; group —— 数据组织类型,默认为“genes and gene prediction tracks”; track —— 数据检索方式,默认为“USCS tracks”; table —— 输出数据表,默认为“knownGene”; output format —— 数据输出格式; output file —— 输出文件名。 点击“get output”下载基因组数据。 2.4 蛋白质序列数据库 早期的蛋白质序列数据库主要有:由NCBI建立的Protein序列数据库、由美国国家生物医学研究基金会建立的PIR序列数据库和由瑞士生物信息研究所建立的Swiss-Prot序列数据库。 目前,PIR、TrEMBL已与Swiss-Prot蛋白质序列数据库合并为UniProt蛋白质序列数据库。 2.4.1 NCBI蛋白质序列数据库 2.4.2 UniProtKB蛋白质序列数据库 包含所有已知序列的野生型蛋白质的信息,其核心的蛋白质序列数据库为UniProtKB。数据库中所提供的蛋白质结构与功能信息非常全面。 UniProtKB蛋白质序列数据库格式文件所包含的内容有: ① Names and origin —— 名称和来源; ② Protein attributes —— 蛋白质属性; ③ General annotation (Comments)——综合注解; ④ Ontologies —— 本体论(建模、明确、识别、分享); ⑤ Sequence annotation (Features) —— 序列注解; ⑥ Sequences —— 序列; ⑦ References —— 参考文献; ⑧ Cross-references —— 交叉引用; ⑨ Entry information —— 注册信息; ⑩ Relevant documents —— 相关文件。 2.5 结构数据库 结构数据库收集并贮存生物大分子三维结构原始测量数据,其中主要是蛋白质分子三维结构数据库。 生物大分子的三维结构数据格式文件可通过特定的显示软件而直观地以图形方式表示出来。 2.5.1 蛋白质结构数据库 主要的蛋白质三维结构数据库是PDB(Protein Data Bank)数据库。此外,NCBI的Structure数据库(MMDB,the Molecular Modeling Database)也包含PDB的全部数据。 生物大分子的三维结构X射线衍射测量数据均以文本文件形式贮存,其后缀为.pdb,可用专门的软件打开或显示。 2.5.2 三维结构显示软件 常用的生物大分子三维结构显示软件包括:RasMol软件(Bernstein HJ)和Cn3D软件(NCBI)和Swiss-PdbViewer(SIB)等。 下载地址(适用于Windows XP): /software/RasMol__Windows_Installer.exe /cn3d/Cn3D-4.3.msi http://spdbv.vital-it.ch/download/binaries/SPDBV_4.10_PC.zip 2.6 生物数据库的信息检索 为了帮助用户从浩如烟海的生物实验数据中获取有用的数据资料,并对数据进行科学的分析和处理,各生物信息数据库系统均开发了一系列的实用工具软件,主要的有: GQurey —— NCBI数据库检索工具软件; SRS —— EBI的数据库检索工具软件; UniProt —— 蛋白质序列检索工具软件。 2.6.1 GQurey检索工具: 网址:/gquery GQurey(以前称为Entrez)是NCBI开发的数据库检索系统。 通过该检索系统,用户可对NCBI中的数据资料快速进行交叉检索,这些数据资料包括核苷酸序列、蛋白质序列、生物大分子结构、全基因组以及文献摘要。 目前,GQurey链接的数据库主要有: PubMe
文档评论(0)