- 1、本文档共71页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基因芯片数据分析简介董
动画,cDNA芯片实验原理 对不同波长荧光的偏向 芯片的质量 位置尺度的归一化 Volcano plot (Significance) Volcano plot (Effect) Volcano plot 什么是聚类分析 将不同元素按照彼此相似性的大小按照一定的规则进行组织或者分类 元素 相似性 等级聚类/归类 聚类在生物分析中的应用 进化树 不同物种同源蛋白序列的相似性 聚类在基因芯片数据分析中的应用 基因之间存在共表达 共表达的基因可能具有相似的生物功能 从具有相似表达谱的基因去推测其功能 更好的可视化 选取何种距离 K均值聚类 选择合适的聚类数据 k 初始化k个聚类中心 ?1,… ?k 从所有数据点中挑选k个点 将数据随机分为k类,以每类的中心作为聚类中心 计算每个数据点与每个中心的相似性,将数据点归类到最相似聚类中心所属的类中去 当所有数据归类完毕后,重新计算每个聚类的中心,作为新的聚类中心 重复计算所有数据点与新的聚类中心的相似性,并且再次归类 当聚类中心不在发生变化时,聚类停止 该分为多少类? 对k均值聚类的结果可视化 对k均值聚类的结果可视化 对于超过2维的数据,提取最高的两个主成分(PC) 等级聚类 将数据重新排序 组与组之间的距离 Single Linkage Clustering Minimum distance between members of two clusters Complete Linkage Clustering Greatest distance between members of relevant clusters Average Linkage Clustering UPGMA Centroid or Median 如何进行分类 其他名称 功能富集 Pathway富集 显著/重要的pathway/通路 GO富集 基因集合分析的优点 基因不是单独起作用的 有助于更好的理解基因的功能 也有助于理解关键基因是如何影响关键通路的 找到显著的功能,可以缩小寻找关键基因的范围 在一组差异表达基因中寻找富集的生物功能 Over-representation analysis (ORA) 例子 具体流程 谢谢 Over representation analysis (ORA) in set else total differential n11 n12 n1+ else n21 n22 n2+ total n+1 n+2 n By Fisher’s exact test / chi-square test In set else Total Differential 40 960 1000 Else 160 8840 9000 total 200 9800 10000 P-value from Fisher’s Exact test: 2.085e-5 GO/pathway 差异表达基因 背景基因 相同的基因ID类型 2x2列联表 计算显著性 DAVID的使用 开始分析 / DAVID的使用 选中Upload栏 输入基因列表 选择基因列表的ID类型 选中“Gene List” DAVID的使用 选择相应的物种 进行功能富集 DAVID的使用 选择相应的数据库 进行功能富集 DAVID的使用 功能富集结果页 * 聚类分析 Eisen et al. (1998), PNAS, 95(25): 14863-14868 聚类分析 在聚类分析中,基因被看作是一个向量 通过元素与元素之间的距离,将不同的元素归类 数据结构(表达值矩阵,log2Ratio) Array1 Array2 Array3 Array4 Gene1 0.5 -1.8 0.8 1.2 Gene2 -0.2 1.2 -0.4 0.1 Gene3 2.0 1.2 -0.1 0.5 Gene3 1.1 0.6 -1.0 0.8 Gene5 1.5 -1.2 0.2 0.7 Gene6 2.4 -0.5 2.2 1.5 Gene 1: (0.5, -1.8, 0.8, 1.2) Gene 2: (-0.2, 1.2, -0.4, 0.1) 聚类分析: 距离的定义 欧式距离 相似性距离——皮尔森相关系数 聚类分析:k均值聚类 将所有点放入k个不重叠的类中,使得每个类中基因相似度高,而类之间基因的相似度低。
您可能关注的文档
最近下载
- IATF 16949试题附有答案.docx VIP
- 机动车与非机动车区别.ppt VIP
- 高中思想政治选择性必修第1册 综合探究 国家安全与核心利益.ppt VIP
- 2024至2030年中国脱水蔬菜行业销售形势分析及投资规模预测报告.docx
- 王戎不取道旁李教学设计一等奖(集锦4篇).docx
- 油用牡丹种植效益分析.doc
- DreamweaverCC实例教程01 初识Dreamweaver CC 2019.pdf VIP
- 人教版(2024新版)九年级上册化学:第五单元 化学反应的定量关系 教案教学设计(2个课题+1个活动).docx
- 湘教版初中数学知识点总复习资料.pdf
- 医药公司财务管理制度.docx
文档评论(0)