gcms数据高性能分析算法研究-research on high performance analysis algorithm of gcms data.docx

gcms数据高性能分析算法研究-research on high performance analysis algorithm of gcms data.docx

  1. 1、本文档共83页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
gcms数据高性能分析算法研究-research on high performance analysis algorithm of gcms data

摘 要气相色谱-质谱联用仪(GC-MS)因具有鲁棒性、高灵敏度、高可检测范围等优点, 已被广泛运用于食品安全、医药、生化等领域的研究,是公认的分析和检测复杂样品 的重要手段之一。国家已把发展国产质谱仪列为长远规划,目前国产质谱仪不仅核心 检测器件比较落后,质谱数据处理算法和软件的研究也才刚刚起步。GC-MS数据处理需经过去噪、基线校正、谱峰识别、重叠峰解析、保留时间对齐 和数据挖掘等步骤,其中重叠峰解析和保留时间对齐这两步最具挑战性和最耗时,急 需精确的自动化算法。现有质谱分析算法大多只能处理单个样本、功能单一、计算速 度缓慢、无法自动完成,难以满足有效管理、快速分析挖掘海量GC-MS数据的需求,成 为制约质谱技术应用的瓶颈。为有效解决上述问题,本论文提出一种高度集成的智能GC-MS数据处理技术的构 想,其主要工作如下:(1)GC-MS数据描述与已有算法分析。首先对GC-MS数据、提取离子流、总离子 流进行数学描述并说明其物理意义;对GC-MS原始数据处理流程和方法、质谱标准数 据检索进行了综述;最后对现GC-MS数据处理免费软件进了汇总和介绍。(2)提出一种用于GC-MS重叠峰精确解析的差异变量-多元曲线分辨(DV-MCR) 方法。针对MCR-ALS算法用于GC-MS重叠峰解析时难以确定主成分数和初始矩阵而 导致计算结果不够精确的问题,提出DV-MCR方法,并模拟不同条件的数据进行验证, 结果表明,该方法比传统的MCR-ALS方法解析结果更加精确。(3)采用动态规划方法对保留时间对齐。针对其它保留时间对齐方法结果不够精 确,难以自动化完成的问题,将动态规划成功引入保留时间对齐,该方法同时依赖特 征峰所在的保留时间和质谱,可以同时对大量GC-MS样本进行自动对齐,并通过实验 数据验证了该方法的对齐效果。(4)提出一种通用的基于多线程的并行交叉验证框架。针对GC-MS数据挖掘过程 中,机器学习算法在模型评估时使用交叉验证计算量非常大、非常耗时的问题,提出 了一种通用的基于多线程的并行交叉验证框架,并使用SVM和PLS算法,通过不同大 小的数据集对框架验证其有效性。(5)提出CloudChem—一种基于云计算的化学计量学软件服务。它采用软件即服 务模式和并行计算技术,可以较好克服传统化学计量学软件的缺点,基于该方法的软 件服务平台可实现光谱、色谱、质谱等数据的有效、高速、一体化的存储、分析、挖掘, 最大限度减小用户在使用化学计量软件的基础设施成本和软件成本。关键词:质谱; 气相色谱; MCR; 峰对齐; Parallel-CV; 云计算; 并行计算; CloudChem万方数据I –AbstractBecause of the strong robustness, high sensitivity, long detection range, etc, the Gas Chromatography - Mass Spectrometry, which is believed to be the important way to analysis and detect the complex samples, is widely used in many research fields, such as food safe, medicine, biochemical, and so on. At present not only the core detection devices of home- made mass spectrometer are relatively laggard, but also its software and data processing algorithm are in their infancy, yet it is in the long range planning of China.In the raw data processing steps of GC-MS(including de-noising, baseline, future de- tection, resolving overlapped peaks, aligning retention time, data mining, etc), the resolving overlapped peaks and aligning retention time are most challenging and time-consuming, which are eager for accurate auto-algorithm. The existing analysis algorithms of mass spec-

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档