[第12讲包系统.ppt

  1. 1、本文档共34页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[第12讲包系统

第十二讲 Bioconductor 一系列的包系统,用来处理生物方面的数据 1、Bioconductor是一个开源和开放式软件开发项目。 2、该项目起始于2001年秋季,核心成员是哈佛医学院/哈佛公共卫生学院的Dana Farber癌症研究所生物统计组。 3、Bioconductor软件包 DNA微阵列数据的处理、分析、注释及可视化; 通用分析工具(被广泛用于基因组数据库的分析,如分析基因组序列、SNP数据、SAGE数据、蛋白质组数据等。) 安装Bioconductor软件包 1、安装标准的bioconductor软件包 source(“/biocLite.R”) biocLite() 2、安装特定的xxxx包 source(“/bioLite.R”)连到包的数据库中 biocLite(“xxxx”) #biocLite(“affy”)微阵列预处理 3、菜单栏-程序包 设定CRAN镜像 选择软件库 安装程序包 4、从本地zip文件安装程序包 (/help/bioc-views/release/bioc/) 1、高密度寡核苷酸阵列 每个微阵列产生一个探针水平数据集,一些探针检测特异的全匹配寡核苷酸(PM),另一些检测非特异的失匹配寡核苷酸(MM)。 2、cDNA微阵列 每个微阵列产生两个探针水平数据集(红色和绿色通道) 三、高密度寡核苷酸阵列的预处理 Affymetrix公司是目前最大的、也是主要的寡核苷酸芯片生产和销售公司。 芯片上的每个基因或EST都是由一个或几个探针组(probe set)组成,每组探针组又由11-20对25mer的探针对(probe pair)组成,每探针对包括两个探针单元(probe cell),一个完全匹配探针(PM,perfectmatch)和一个中间位点互补的失配探针(MM,mis-match),用PM与MM之间的差值作为信号强度。 每一条探针的荧光强度数据称为探针水平数据(probe level data)。 预处理概述 1.1简介 探针+靶序列?杂交Hybridization?专业扫描器检测与每个探针杂交的靶序列数量,得到其强度 ?预处理 1.2任务 图像分析、数据导入、背景校正、归一化、汇总、特定探针校正 ①图像分析(image analysis) 将扫描图像中的像素强度转换成探针水平数据(probe-level data)。 ②数据导入(data import) 因为数据以不同的格式输入,需要有灵活的数据导入方法,数据常位于不同的文件或数据库表中。 ③背景校正(background adjustment) 被检测的探针强度取决于非特异性杂交和光学检测系统的噪声,通过对观察强度的校正来给出特异杂交的精确检测。 ④归一化(normalization) 对不同来源的不同杂交阵列进行比较(逆转录、加标记、杂交反应的不同效果、阵列的物理问题、反应物批量效应和实验环境),校正系统阵列间的差异。 ⑤汇总(summarization) 有些平台,转录物由多重探针表示。对于每个基因,校正后的背景和归一化的强度需要汇总成一个总数,估计RNA转录物数量比例。 ⑥特定探针校正(probe specific correction) 校正试验结果中的异常探针水平数据 ⑦质量控制(quality control) 它在可接受的随机波动的水平下进行趋异检测 hist和boxplot可以检查不同阵列的探针强度状态; hist(Dilution) boxplot(Dilution, col = c(1,2, 3, 4)) MA图:将散点图坐标轴旋转45度,另外横轴为Aj=(Y2,j +Y1,j)/2,纵轴为Mj=Y2,j -Y1,j ,Y1 和Y2 分别为两块芯片探针数据的对数 Aj 表示两快芯片对应探针数据的对数均值 Mj表示对应探针数据的比值的对数; affy软件包中提供两个方法画MA图:mva.pairs、MAplot 反映表达差异 gn - geneNames(Dilution) gn[100] [1] 109_at pm(Dilution, gn[100]) 20A 20B 10A 10B 109_at1 372.0 261.3 272.5 170.0 109_at2 144.0 84.0 108.0 67.0 109_at3 365.0 243.0 263.0 163.0 109_at4 536.5 352.0 371.3 254.5 109_at5 441.0 265.0 256.0 183.0 109

文档评论(0)

xuetingting + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档