生物信息学的基因聚类实际分析.ppt

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基因表达数据的聚类分析;;;;;几种常用的聚类方法 ;1、简单聚类 假设有n个基因 表达数据向量分别为X1, X2,…, XN 令任意一个基因的表达向量为第一个聚类的中心 依次处理其它基因 在处理第i个基因时,首先计算该基因的表达数据向量与现有各类中心的距离 假设与第j类的距离Dij最小,并且DijT,则将基因i分配到第j类;否则生成一个新类,该类的中心为第i个基因的表达向量。;;3、K平均聚类 任意选取K个基因表达向量作为初始聚类中心 Z1, Z2,…, Zk 反复迭代计算 如果||X-Zj(l)|| ||X-Zi(l)||(i=1,2,…,K,i?j),则将X所代表的基因归于第j类。按照上述办法处理所有的基因; 经过上述处理,聚类可能发生变化,因此需要重新计算K个新聚类中心: 对于所有的聚类中心,如果Zj(l+1)=Zj(l)(j=1,2,…,K),则迭代结束,得到最后的聚类结果;否则继续进行迭代计算。 ;;;5、模糊聚类分析方法 主要过程: (1)建立模糊相似矩阵 (2)生成模糊等价矩阵 (3)构建动态聚类图;6、聚类结果显示 ;分类分析方法 有监督学习 疾病诊断、细胞类型识别 样本分类:(例) 急性淋巴细胞白血病(ALL) 急性髓性白血病(AML);例:两类划分 ;问题: 基因的选择? 分类的方法? 贝叶斯分类法 支持向量机(SVM) k最近邻法 神经网络方法 决策树方法 投票分类法(多分类器) ;;;;;基因调控网络分析; 基因表达在化学催化中的作用;;;;几种基因调控网络模型 ;A B C A B C ;;2、线性组合模型;3、加权矩阵模型;4、互信息关联网络;基因表达数据的聚类分析;;;;;几种常用的聚类方法 ;1、简单聚类 假设有n个基因 表达数据向量分别为X1, X2,…, XN 令任意一个基因的表达向量为第一个聚类的中心 依次处理其它基因 在处理第i个基因时,首先计算该基因的表达数据向量与现有各类中心的距离 假设与第j类的距离Dij最小,并且DijT,则将基因i分配到第j类;否则生成一个新类,该类的中心为第i个基因的表达向量。;;3、K平均聚类 任意选取K个基因表达向量作为初始聚类中心 Z1, Z2,…, Zk 反复迭代计算 如果||X-Zj(l)|| ||X-Zi(l)||(i=1,2,…,K,i?j),则将X所代表的基因归于第j类。按照上述办法处理所有的基因; 经过上述处理,聚类可能发生变化,因此需要重新计算K个新聚类中心: 对于所有的聚类中心,如果Zj(l+1)=Zj(l)(j=1,2,…,K),则迭代结束,得到最后的聚类结果;否则继续进行迭代计算。 ;;;5、模糊聚类分析方法 主要过程: (1)建立模糊相似矩阵 (2)生成模糊等价矩阵 (3)构建动态聚类图;6、聚类结果显示 ;分类分析方法 有监督学习 疾病诊断、细胞类型识别 样本分类:(例) 急性淋巴细胞白血病(ALL) 急性髓性白血病(AML);例:两类划分 ;问题: 基因的选择? 分类的方法? 贝叶斯分类法 支持向量机(SVM) k最近邻法 神经网络方法 决策树方法 投票分类法(多分类器) ;;;;;基因调控网络分析; 基因表达在化学催化中的作用;;;;几种基因调控网络模型 ;A B C A B C ;;2、线性组合模型;3、加权矩阵模型;4、互信息关联网络;

文档评论(0)

祝星 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档