网站大量收购闲置独家精品文档,联系QQ:2885784924

7基因芯片数据分析.ppt

  1. 1、本文档共45页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基因芯片数据分析 1. 基因芯片(Microarray)简介 2. 图像处理与数据标准化 3. 基因芯片的数据分析 1. 基因芯片简介 基因芯片 (1987): 固定有寡核苷酸、DNA或cDNA等的生物芯片。利用这类芯片与标记生物样品进行杂交,可对样品基因表达谱生物信息进行快速定性和定量分析。 高通量、点阵以及Northern杂交 同时测定细胞内数千个基因的表达情况 将mRNA反转录成cDNA与芯片上的探针杂交 芯片的体积非常小:微量样品的检测 基因表达情况的定量分析 生物芯片的基本要点 A. 按技术手段、探针类型分类 1. Short oligonucleotide arrays (Affymetrix) 2. cDNA arrays (Brown/Botstein) 3. Long oligo arrays (Agilent) 4. Serial analysis of gene expression (SAGE) B. 按实验要求分类 1. 单通道 (Single Channel): 一次检验一种状态 2. 双通道 (Dual Channel): 差异表达基因的筛选 (1). cDNA microarrays: 将500~5,000bp的cDNA固载到介质上 (例如玻璃)。Stanford开发设计,通常为双通道,常用于差异表达基因的筛选。 (2). DNA chips: 将寡核苷酸探针 (20~80-mer) 合成到芯片上。Affymetrix开发设计,通常为单通道,一次检验一种状态 。 探针长度:25 bp 每个基因:22-40个探针 Perfect Match (PM) vs. MisMatch (MM) probes 三、基因芯片数据分析 1. 基因芯片(Microarray)简介 2. 图像处理与数据标准化 3. 基因芯片的数据分析 2. 图像处理与数据标准化 对于每个点,可以计算 Red intensity = Rfg - Rbg fg = foreground, bg = background, and Green intensity = Gfg - Gbg and combine them in the log (base 2) ratio Log2( Red intensity / Green intensity) Green intensity (medium): ~1 1. 图像分析 2. 扫描 3. DNA杂交过程 (温度、时间、混合均匀程度等) 4. 探针的标记 5. RNA的抽提 6. 加样 7. 其他 运用哪些基因进行标准化处理 芯片上大部分基因(假设芯片上大部分基因在不同条件下表达量相同) 不同条件间稳定表达的基因(如持家基因) 控制序列(spiked control ) 合成DNA序列或外源的DNA序列,在不同条件下表达水平相同。 三、基因芯片数据分析 1. 基因芯片(Microarray)简介 2. 图像处理与数据标准化 3. 基因芯片的数据分析 3. 基因芯片的数据分析 (1) 差异表达基因的分析 (2) 基因共表达分析 (3) 基因表达数据的聚类 (4) 基因表达数据的分类 (5) Map to GO (6) Gene regulatory network (1) 差异表达基因的分析 差异表达基因的分析: 寻找处理前后表达上调或者下调的基因 Are the treatments different? 使用标准的统计学方法检验 (t-test or f-test),发现统计显著性差异表达的基因, 如果处理本身并不显著,则结果无意义 Fold change, 一般2-fold increase or decrease (平行实验的样本较少) p-value (平行实验的样本较多) T-test: 学生分布 Excel函数:TTEST(array1,array2,tails,type) Array1为第一个数据集 Array2为第二个数据集 Tails指示分布曲线的尾数。如果 tails = 1,函数 TTEST 使用单尾分布。如果 tails = 2,函数 TTEST 使用双尾分布 Type为 t 检验的类型 1 成对 2 等方差双样本检验 3 异方差双样本检验 一般选择双尾分布 异方差双样本检验 Excel函数:=TTEST(B2:D2,E2:G2,2,3) C:对照组;T:实验组 (2) 基因共表达分析 在N个不同的条件下 (时间序列的芯片数据),考察基因X和Y的表达是否相似。 Gene 1#是否与Gene 2#、Gene 3#和Gene 4#共表达? 共表达: 正相关:相似的表达谱,可能存在正关联 负相关

文档评论(0)

shaoye348 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档