- 1、本文档共15页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
HGVS基因变异命名规则
随着基因检测技术的发展及其在临床的广泛应用,越来越多与疾
病相关的基因和变异被明确。为了让变异注释更程序化、对变异
文献的检索更全面化以及对变异的描述更标准化,建立统一而通
用的变异命名规则变得尤为重要。
HGVS
参考序列必须是是NCBI或EBI数据库中的ID,必须同时包含accession和version信息,
如NC_000023.10, NC_000023代表编号,10代表版本号。
DNA
• g. = 线性基因组参考DNA序列
• o. = 环状基因组参考DNA序列
• m. = 线粒体参考序列
• c. = 编码DNA参考序列
• n. = 非编码DNA参考序列
RNA
• r. = RNA参考序列
Protein
• p. = 蛋白参考序列
特殊字符的含义
• “+” :c.123+45AG (代表靠近内含子5’ 端的核苷酸发生变异)
• “-” :c.124-56CT (代表靠近内含子3’ 端核苷酸发生变异);c.-142CG (代表5’ UTR
区)
• “*” :c.*32GA (代表3’ UTR区);P.Trp41* (代表终止氨基酸)
• “[]” :代表等位基因,“;”用来分隔变异和等位基因,如g.[123456AG;345678GC] 代
表顺式,g.[123456AG];[345678GC]代表反式, g.123456AG(;)345678GC代表这
两个变异的顺式反式未知。
• “()” :用来表示不确定的或预测的结果,如p.(Ser123Arg)
特殊字符的含义
• “?” :用来表示核苷酸或氨基酸的位置未知,如g. (?_234567) _ (345678_?)del
• “^” :代表“或”的意思,如p.Ser124Arg反推核苷酸的改变为c.(370AC^372CG^372CA) ,即AGC
变成CGC, AGG或AGA
• “/” :表示嵌合体(mosaic),如NM_004006.1:c.145=/CT
• “//” :表示异源嵌合体(chimeric),如NM_004006.1:c.85=//TC
• “|” :代表不是序列的直接改变,而是一种修饰或一种状态的改变,如甲基化。
• “::” :用于描述RNA融合转录本和断点连接形成的环状染色体
缩写字符的含义
• “fs”代表变异类型为移码变异,主要是针对蛋白水平而言,如p.Arg456GlyfsTer17或
p.Arg456Glyfs*17
• “ext”代表变异类型为延长,主要是针对起始密码子和终止密码子变异导致的蛋白水平的
改变,如p.Met1ext-5
• “gom” 表示获得甲基化,如g12345901|gom
• “lom”表示去甲基化,如g12345901|lom
• “met” 表示甲基化,如g12345901|met=
基因结构
编码区(CDS):以起始密码子ATG的第一个碱基A开始,并记为c.1 ,以终止密码子(TAA,
TAG, TGA)的最后一个碱基为终点
内含子区(Intron):
Ø 靠近内含子5’末端的变异位 ,需依据上游最近外显子的最后一个碱基来定位,如c.87+ ,
代表上游最近外显子的边界位置为87 ,变异位点在内含子5’ 端开始的第 个碱基;
Ø 靠近内含子3’ 末端的变异位 ,要依据下游最近外显子的第一个碱基来定位,如c.88-11 ,
代表下游最近的外显子的边界位置为88 ,变异位点在内含子3’ 端开始的第11个碱基;
Ø 内含子碱基个数为偶数时,中间碱基平分后按上下游外显子碱基来定位命名,如
…,c.87+676, c.87+677, c.87+678, c.88-678, c.88-677, c.88-676, …
Ø 内含子碱基个数为奇数时,中间碱基相对于上游外显子最后一个碱基来定位命名,如
…,c.87+677, c.87+678, c.87+679, c.88-678, c.88-677, …
Ø 最初内含子的书写方式有两种c.88+2TG和c.IVS2+2TG,目前的HGVS命名规则取消
c.IVS的使用,包括c.EX也不再使用。
基因结构
(3)非编码区(UT
文档评论(0)