网站大量收购独家精品文档,联系QQ:2885784924

孙宝发-Negative impact of noise on the - 生物化学与分子生物学.PPT

孙宝发-Negative impact of noise on the - 生物化学与分子生物学.PPT

  1. 1、本文档共40页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
孙宝发-Negative impact of noise on the - 生物化学与分子生物学

Negative impact of noise on the principal component analysis of NMR data 对核磁共振数据进行主成分分析时噪音的负面影响 Challenges of Metabonomics Sample Complexity and Data Handling Each sample has.., a wide range of compound classes a wide variation in metabolite concentrations a large number of potential components The strategy for large scale metabonomics research 核磁共振(NMR) 主要技术 能对样品实现非破坏性,非选择性的分析 1H-NMR对含氢化合物均有响应,能完成代谢产物中大多数化合物的检测,满足代谢组学中的对尽可能多的化合物进行检測的目标. 不足: 其对每个分子的化学和物理环境敏感,样品制备的要求很高,且数据处理比较复杂. NMR的动态范围有限,很难同时測定生物体系中共存的浓度相差较大的代谢产物 硬件投资较大 一、主成分分析 主要原理 基本思想 几何意义 数学模型 软件应用 图形解释 主成份分析的主要原理 在多数实际问题中,不同指标之间是有一定相关性。由于指标较多及指标间有一定的相关性,势必增加分析问题的复杂性。 主成分分析就是设法将原来指标重新组合成一组新的互相无关的几个综合指标来代替原来指标。同时根据实际需要从中可取几个较少的综合指标尽可能多地反映原来的指标的信息。 从数学角度来看,这是一种降维处理技术。很显然,识辨系统在一个低维空间要比在一个高维空间容易得多。 主成分分析的基本思想 将原来众多具有一定相关性的指标重新组合成一组新的相互无关的综合指标来代替原来指标。 以两个指标为例,信息总量以总方差表示: 其中y1、y2分别都是x1、x2的线性组合,并且信息尽可能地集中在y1上。在以后的分析中舍去y2,只用主成分y1来分析问题,起到了降维的作用。 主成分分析就是通过适当的变量替换,使新变量成为原变量的线性组合,并寻求主成分来分析事物的一种方法。 主成分分析的几何意义 为了方便,我们在二维空间中讨论主成分的几何意义。设有n个样品,每个样品有两个观测变量xl和x2,在由变量xl和x2所确定的二维平面中,如果n个样本点形成一个椭圆形状的点阵(这在变量的二维正态的假定下是可能的) 但是,坐标轴通常并不和椭圆的长短轴平行。因此,需要寻找椭圆的长短轴,并进行变换,使得新变量和椭圆的长短轴平行。 那么这个椭圆有一个长轴和一个短轴。在短轴方向上,数据变化很少;椭圆的长短轴相差得越大,降维越有道理。 在极端的情况,短轴如果退化成一点,那只有在长轴的方向才能够解释这些点的变化了;这样,由二维到一维的降维就自然完成了。 软件应用 成绩数据(student.sav) 100个学生的数学、物理、化学、语文、历史、英语的成绩如下表(部分)。 主成分分析实例1-不旋转 使用默认值进行最简单的主成分分析(默认为主成分分析法:Principal components) 菜单:Analyze-Data Reduction-Factor   (主成分分析法Principal components,选取特征值1,不旋转) 模式识别与分类 模式识别与分类   PCA is used to simplify the examination of complex metabolite mixtures obtained from biological samples that may be composed of hundreds or thousands of chemical components. A common concern with PCA of NMR data is the potential over emphasis of small changes in high concentration metabolites that would over-shadow significant and large changes in low-concentration components that may lead to a skewed or irrelevant clustering of the NMR data.We have identified an additional concern, very small

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档