实验6 基因芯片数据处理分析与GO分析.pdf

  1. 1、本文档共21页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实验6 基因芯片数据处理分析与GO分析

实验六: 基因芯片数据处理和分析、GO 分析 实验目的: 1. 学会使用TM4 软件集对芯片数据进行处理和分析,学会使用Cluster 进行聚类分析 3. 学会GO 语义及其相关注释的浏览与有哪些信誉好的足球投注网站,学会使用DAVID 进行基因集功能富集分析 实验内容: 一、基因芯片数据处理和分析 基因芯片或称微阵列(microarray )能够平行、高通量地检测成千上万基因转录本的表 达水平,应用芯片技术可以比较正常和异常细胞中的表达,帮助识别疾病相关基因和药物作 用靶标,分析复杂疾病的致病机制,也可以揭示基因间的表达调控关系。基因芯片数据处理 包括芯片杂交实验芯片数据采集(扫描)数据基本处理提交数据库生物信息学分析 等步骤,涉及很多不同的实验类型。这里介绍TIGR 中心开发的TM4 软件包,应用MeV 、 Cluster 和TreeView 等软件对相关基因表达谱进行聚类分析和差异表达基因的筛选。 1、芯片数据的获取与处理 芯片杂交试验完成后,借助扫描仪将杂交信号形成TIF 图像,通过图像分析软件从中提 取原始杂交信号强度值,并将其转换成数字文本文件。但是不同扫描仪产生的数据格式不尽 相同,因此,需要对不同平台的数据进行转换和整合。 1.1、ExpressConverter 数据格式转换 TM4 ( )的ExpressConverter 可将其他格式的数据文件转换为 MEV 格式以供后续分析。由于该软件的运行需要 Java 运行环境支持,故第一次使用之前需要预 先安装Java Runtime Environment ( )。完成ExpressConverter 安装后,在 开始菜单中找到Expressconverter 并打开,出现软件主界面(Figure 6.1)。 Figure 6.1 ExpressConverter 可以读取Genepix、ImaGene、ScanArray、ArrayVision 、Agilent 、TAV 、 Customized、Gal 等格式的数据并将其转换成TM4 能够使用的MEV 格式。这里以Genepix 文件转换为例,说明ExpressConverter 的使用过程。 (1)在”Input Format”菜单中选择“GenePix”,指定它为读入文件格式。 (2 )在“File”菜单中选择“Select input files”,选定一个或多个需要转换的GenePix 文件 (扩展名为.gpr)。本例从该软件的默认安装目录下,即C:\ExpressConverter\samples\ 中选择 testdata.gpr 文件(Figure 6.2)。 Figure 6.2 (3 )在界面下方选择“Integrated”,然后在“File”菜单下选择“Start converting”,开始转 换格式,直到界面下方显示“Converting is successful”,完成转换。此时,在原目录中会出现 文件名相同但扩展名不同的.mev 和.ann 文件,它们可用记事本或Excel (推荐)打开。 .mev 文件包含注释(comments )和数据(data ),其中以“#”开头的注解部分包括文件版 本号、生成日期、数据的行数等基本信息,数据部分则详细地列出芯片中每个探针的位置、 信号强度等杂交信息(Figure 6.3)。例如,UID 为探针标识号;IA 、IB 分别表示Cy3 (对照) 和Cy5 (样本)的杂交信号强度;R 和C、MR 和MC 、SR 和SC 这三对数值指定了探针在 芯片中的位置;其他各列参数分别反映对照(A )和样本(B )的杂交背景、面积、信号强 度的中值等。 Figure 6.3 .ann 文件是一个芯片注释文件,用于存储每个探针的注释信息。其中UID 表示探针的 标识号,R 和C 分别表示探针在芯片中的位置,Name 和ID 分别表示探针所代表的基因名 和检索号(Figure 6.4)。 Figure 6.4 1.2、MIDAS 数据过滤和标准化 芯片杂交试验所产生的原始数据需要对低质量数据作过滤处理,即表达水平是负值或很 小的数据或明显的噪

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档