网站大量收购闲置独家精品文档,联系QQ:2885784924

MS-IAS集成的质谱代谢组学数据分析系统.pdf

MS-IAS集成的质谱代谢组学数据分析系统.pdf

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
MS-IAS集成的质谱代谢组学数据分析系统.pdf

第40卷 分析化学(FENXIHUAXUE)研究报告 第9期 2012年9月 ChineseJournalof 1366一1373 AnalyticalChemistry MS-IAS:集成的质谱代谢组学数据分析系统 林晓惠¨ 明迪1 张洋1 阮强1 王全才1 张瑞1 严康1 李红1 李海燕1 许国旺2 1(大连理工大学计算机科学与技术学院,大连116024) 2(中国科学院大连化学物理研究所,中科院分离分析化学开放实验室,大连116023) 摘 要针对代谢组学研究中的数据处理问题,本研究建立了基于质谱的数据分析系统MS-一IAS(Mass spec— based trometryintegratedanalysissystem)。此系统集成了特征选择、聚类、分类等多种方法,用以处理质谱数 据,具有多种统计分析方法能对所选的特征变量进行比较,以发现与所研究问题相关的潜在生物标志物。 MS-IAS支持数据与多种算法结果可图形化显示,有助于对数据的解释与分析。以肝病患者的质谱代谢组数 据为例,展示MS-一IAS的功能,两种特征选择算法从数据集中筛选出了40个对肝病具有区分能力的特征变 量,展示了MS—IAS成为代谢组学研究中的通用质谱数据分析系统的潜力。 关键词代谢组学;质谱;特征选择;分类;聚类 1 引 言 与生理、病理变化相关的代谢成分,已经广泛应用于疾病诊断、药物研制、营养研究等领域【11。质谱及其 联用技术和核磁共振是代谢组学研究常用的分析技术阱31。相对于核磁共振,质谱具有灵敏度高、能够 测定更多的代谢成分等优势州。近年来,其在代谢组学研究中的作用日益显著o~5J。但质谱数据的维数 通常很高,其中不乏噪音和问题无关的变量,加之代谢数据的复杂性,数据的处理和解释非常困难㈣71, 已经成为代谢组学研究中的瓶颈之一[s】。 代谢组学数据处理主要包括数据预处理、降维、分类和聚类等,以寻找能反映生物样本的内在机理、 区分不同生物样本以及揭示在不同刺激下生物样本的应答差异的潜在标志物等。因此各种统计学、化 学计量学以及机器学习方法被应用到代谢组学数据的处理之中阶12】。多元统计分析的系统软件,诸如 特征变量,操作简单,图形显示功能强大。SPSS可以对数据进行管理和分析,以命令行的方式进行操 作。MATLAB、WEKA提供算法源码和二次开发接口,用户可以自己导入/编写相关的算法程序。虽然 WEKA提供贝叶斯,随机森林等数据分析功能,但需要使用者具有一定的算法基础。MDASn3I是针对代 谢数据开发的分析系统,以峰表(峰表中包含挖个样本,每个样本包含m个代谢成分)为处理对象,提供 法,可以进行数据预处理、特征选择和分类模型建立。Automics[1铂直接处理分析仪器导出的数据,通过 峰识别、峰匹配得到峰表【l31。该系统几乎包含了代谢物数据分析的全部功能,将PCA等多元统计分析 功能和k最近邻(kNN)、SVM等分类功能集成在一起。 不同的数据挖掘算法由于其原理不同,在具体的代谢数据分析问题上表现的性能也不尽相同。同 时,由于质谱数据包含大量特征变量,其中少量的变量特征子集就可以将不同的样本很好地区分。而这 样的特征子集可能会存在多个,不同的分析算法会给出不同的分析结果;单一算法的结果通常只能反映 问题的一个侧面。由于生命过程的复杂性,将不同方法组合起来就可从不同角度筛选与问题相关的潜 201卜11一14收稿;201:.2-04-20接受 本文系国家重大科技专项(No.2012ZXl0002011)资助项目 +E-maik data目@dlut.edu.cn 万方数据 第9期 林晓惠等:MS-IAS:集成的质谱代谢组学数据分析系统 在生物标志物。多角度协同,可更全面、深刻地理解生命过程。本研究开发了一个集成的质谱代谢组学 数据分析系统(M懿s

文档评论(0)

文档精品 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6203200221000001

1亿VIP精品文档

相关文档