dbSNP数据库.ppt

  1. 1、本文档共39页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
dbSNP数据库.ppt

dbSNP数据库 SNP(Single Nucleotide Polymorphism)综述 有的人吸烟喝酒却长寿,也有人自幼就病痛缠身;同一种治疗肿瘤的药物对一些人非常有效,对另一些人则完全无效。这是为什么?答案是他们基因组中存在的差异。这种差异很多表现为单个碱基上的变异,也就是单核苷酸的多态性(SNP)。 2001年二月,美、英等国宣布完成了人类基因体定序及分析初稿,这项划时代的创举将人类基因体科技带入新的境界,也连带开启了分子生物学、蛋白质体学、药物基因体学等新研究趋向。人类基因译码初稿的完成,象征着人类基因体解读计划的第一阶段已告一段落。但接下来对于基因定序数据的检测与分析,以及运用这份草图来寻找个体间基因序列差异性的任务,才刚刚开始。 了解个体间基因序列差异性的研究,不但对族群遗传学、演化学的研究相当重要,在利用连锁不平衡(Linkage Disequilibrium)进行复杂性遗传疾病(multiple genes diseases)的相关性研究上也扮演重要的角色。 SNP概念及其类型 SNP,念法为〔snIp〕,是Single Nucleotide Polymorphism的英文简称,其中文译为“单一核苷酸多型性”,意思是“DNA序列中的单一碱基对(base pair)变异”,也就是DNA序列中A、T、C、G的改变,即基因组的一个特异和定位的位点出现两个或多个的核苷酸可能性,它是人类可遗传的变异中最常见的一种。占所有已知多态性的90%以上。SNP在人类基因组中广泛存在,平均每500~1000个碱基对中就有1个,估计其总数可达300万个甚至更多。目前科学界已发现了约400万个SNPs 。 SNP所表现的多态性只涉及到单个碱基的变异,这种变异可由单个碱基的转换(transition)或颠换(transversion)所引起,也可由碱基的插入或缺失所致。但通常所说的SNP并不包括后两种情况。 DNA分子示意图 DNA变异类型 基因示意图 基因表达 基因的表达 碱基的 互补配 对原则 T-A A-U C-G 保证了 遗传信 息准确 无误地 表达。 密码子表 dbSNP简介 dbSNP:database of SNP(Wikipedia:The Single Nucleotide Polymorphism Database) 单核苷酸多态性数据库dbSNP(/SNP/)是由NCBI与人类基因组研究所(National Human Genome Research Institute)合作建立的,它是关于单碱基替换以及短插入、删除多态性的资源库。 因为开发dbSNP 是为了补充和辅助 GenBank, 所以它包含了来自任何生物体的核苷酸序列。 dbSNP接收来自公共实验室和私人组织的提交。 dbSNP简介 每个提交至少包括以下10个主要数据元素: 侧翼序列上下文DNA或cDNA、等位基因、方法、种群、样本大小、特定种群的等位基因频率、特定种群的基因型频率、特定种群的杂合度估计、个体基因型、验证信息。 dbSNP必威体育精装版版本公告: dbSNP的数据库结构 完整的数据以多种格式存于ftp站点:/snp/ 数据库结构:自版本125起,dbSNP的设计改为“中心和辐条”模型,其中dbSNP_main表格为车轮的中心,其存储着数据库的主要表格,而车轮的辐条是具体生物体的数据库,其包含着具体生物体的必威体育精装版数据。 dbSNP使用标准的SQL DDL(Data Definition Language)为表格和索引创建模式表(schema tables)、视图。FTP数据库目录(/snp/database/)包含模式(schema)、数据、创建表格和索引的SQL语句。 dbSNP的数据库结构 shared_schema (/snp/database/shared_schema/)子目录包含dbSNP_main中表格的模式DDL(SQL Data Definition Language)。 shared_data (/snp/database/shared_data/)子目录包含所有生物体共享的dbSNP_main的数据。 organism_schema (/snp/database/organism_schema/)子目录包含每种生物体具体数据库的模式DDL的链接。 主表格的表索引提供于位于shared_schema子目录中的dbSNP_main_index_constraint.sql.gz和dbSNP_main_foreign_key.sql.gz文件。 每种生物体具体数据库的表索引位于organism_schema子目录中的organism_taxID_constraint.sql.g

文档评论(0)

tangtianxu1 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档