- 1、本文档共41页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SNP关联分析与复杂疾病
口腔病理研究室
Department of Oral Pathology
School of Stomatology
Peking University
SNP association study and complex diseases
2
1865: crossbreeding experiments
1900 Mendel’s discovery recognized
1944: DNA as the material basis of genetic information
(Avery, MacLeod, McCarty)
3
1953: DNA structure (Watson and Crick)
4
人类基因组计划(human genome project,HGP)
3 billion (1mm: 3000km )
20,000 genes
国际人类基因组单体型图计划 International HapMap Project
2003
5
人类致病基因
6
7
遗传变异→表型差异
疾病易感性、疾病的预后及不同的治疗反应
个体化医疗
8
单基因遗传病
家系连锁分析
定位克隆
9
复杂性疾病
又称多基因遗传病
由多个微效基因的累加效应结合环境因素共同作用所导致的疾病
多个致病基因、每个作用都不大
环境因素
包括大多数人类常见疾病
10
家系连锁分析-复杂疾病
只能检出对表型或疾病影响很强的基因
检验低效基因的效能差:成百上千的家系?
发病晚,外显率低
极少的干扰因素
症状的严重程度和发病年龄差异大,诊断不确定
其发病机制可能不同,涉及不同的生物学通路
确定合适的研究表型、合适的人群:难
11
关联分析(association study)
比较无血缘关系的病例组和对照组之间遗传标记的出现频率
发现与该标记呈连锁不平衡的致病基因
12
连锁不平衡(linkage disequilibrium,LD)
指相邻基因位点上等位基因的非随机性相关
某一位点上的特定等位基因与同一条染色体另一基因位点上的某等位基因同时出现的几率大于人群中因随机分布而使两等位基因同时出现的几率
13
多态性(polymorphism)
A locus with more than one allele, each of which occurs with at least 1% frequency
单核苷酸多态性(Single Nucleotide Polymorphism,SNP)
在基因组水平上由于单个核苷酸的改变而产生的一种DNA序列多态性,其中构成多态性的每个等位基因在人群中出现的频率都不小于1%
14
两个随机个体间基因组DNA的差异:0.1%
其中90%表现为SNP
15
SNP
双等位基因标记
主要等位基因(major allele):在一般人群中较多见的等位基因
次要等位基因(minor allele)
四种可能的形式
一种转换(CT或GA) :2/3
三种颠换(CA或GT,CG或GC,TA或AT)
16
17
SNP作为遗传标记的优势
第一代:限制性片段长度多态性(restriction fragment length polymorphism, RFLP)
第二代:微卫星多态性(microsatellite )
第三代:SNP
变异程度不如微卫星
数量巨大,分布密度高
更稳定的遗传特性
基因分型简单:快速、大批量、自动化
18
SNP概念界定
基因组DNA的差异
cDNA中发现的:可能是RNA编辑的结果?
单碱基的插入和缺失 ?
疾病易感等位基因?
隐性作用、低外显率、数量性状…
在正常人(无病个体)中可出现
19
基因突变(点突变) mutation
通常与某一有害表型相关,是一种罕见的有高外显率的变异
区别突变与SNP: 1%
需要检测有代表性的大范围的人群
判定一个DNA变异是突变而不是SNP,需要说明其所处的确切人群和共检测了多少染色体
20
SNP的数量
人类基因组
每1000个碱基:1个常见SNP
整个基因组:至少300万
少见SNP、特殊人群SNP…
21
SNP的分布及分类
在全基因组范围内的密度分布很不一致
多数:并不位于基因编码区,甚至不在基因区,稳定而无害
编码区SNP(coding SNP,cSNP)
非同义SNP(non synonymous SNP):引起氨基酸的改变,1/3
同义SNP(synonymous SNP)
启动区SNP:基因表达?
邻近外显子区的内含子SNP:mRNA剪切?
22
SNP的形成及演化
发源于点突变
选择性地传递
决定频率的因素
突变发生的时间
选择压力
随机遗传漂变
瓶颈效应
85%以上的SNP为全体人类所共有
23
SNP与疾病
文档评论(0)