网站大量收购独家精品文档,联系QQ:2885784924

叠加多元校正分析.doc

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
叠加多元校正分析 倪网东作者简介:倪网东,屮南人学化学化工学院博士研究牛.,得到国家留学基金委资助,项H满瑞林 作者简介:倪网东,屮南人学化学化工学院博士研究牛.,得到国家留学基金委资助,项H (中南大学化学化工学院,长沙410083) 摘要:木文基丁数据多模羽或(模型融合)建模的思想,开发了两种新的為加多元校正分析 算法:吾加PCR (PLS)多元校正分析和隹加移动窗口 PCR (PLS)多元校正分析。与一般 的变呆选择纽型迪方法不同的是其通过赋予光谱数据中的不同部分不同权巫盜加子多 元校正模型』伙I此,真训以通过权匝调节或,来选择变量。在消除色谱光谱数掘中常见的冗 余信息的同时,避免了常用的变呈选择方法中的信息遗漏的缺点,并最终提高模型的稳健性, 简化了模梨。对于这两个新的算法,尽管其具体步骤不同,但仍取得了相似的预测结果。本 文通过两套近红外色谱血文献数据计算验证了这两个新方法的优越性。 关键词:数锯纽型或_£模型融合2,多元校正分析,叠加多元校正分析,「变耳选择,加 移动窗口多元校正分析。 i引言 为了得到更将确、更稳健的预测模型,色谱光谱数据,尤其是近红外色谱辿数据,经 常包含成百上千的变量⑴。然而,因这些变量中含有大量的冗余信息,最终会降低模型的稳 健性。目前,变量选样(Variable Seleclion or Wavelen21h~sele€lien~)或波长选择⑶-种常用的 处理冗余信息的方法,其通过选择其中一个或一些变量来消除这种冗余信息的影响,从而提 高模型的稳健性和稳疋性。然而,如果抛弃血的变量川含有育用的信息,则又会导致佶息 遗漏,并授终影响模型的结果稳健件。 数拥纽型_血型融合丄Z已经被广泛用于多元校正分析之.屮。其思想是,吾加合并所 有模型(即叠加所有模型)心引的稳健性不会差于在所有模型小的最好的一个。木文利用笔 模羽(模盘融合数据融合的愿想,通过不同的权巫來选择色谓沁数据中的变量,克服常用 变量选择方法中的缺点,町在去除冗余信息影响的同时,极人地提高多元校正模型的稳健性, 并简化模型。 2实验部分: 2.1实验方法: 2.1.1常用符号: 文章中矩阵用大写加粗字母表示(如:X),列向量用小写加粗字母表示(如:y), /JW 罗马字母如“表示标量。 编号:留金字[2007]3020号。现在美国University of Delaware进行合作科研。 *E-m ail: an tony2006s ter @ gm 2.1.2叠加多元校正分析 尽管变量选择U-variaHe^eleetief^^提高多元校正分析模型的稳健性方面起到越來越重 要的作用,但是直接仅仅选取一个或一部分最有效的变鼠进行冋归分析,往往导致信息遗漏, 绘终降低多兀校正模型的稳健性。因此,为了充分利用色谱或存迤数据屮的所有倍息,同 时降低冗余信息的影响,基于影模梨数(模世据融合)的恩想,木文提出了一种新型算法一 —楼加多元校正分析(Stacked PLS和Stacked PCR).首先,色谱光谱数据(X具有加个样 晶和卩个变量)被分成等分,每个部分包含个变量。在每一个等分和目标含量yZ间 应用PLS或者PCR进行普通的多元校正分析,建立一系列并行的PLS或PCR子模型。这 些子多元校正模型将通过不同的权重被叠加并被融合成一个整体。这些权重对子多元校正模 型起到评价作用,如果色谱光谱数据中一-些部分与冃标含最Z间具有更好的线性关系,那么 这些子模型就只有更好的稳健性和准确性,因此,这些子模型就存绘后的多模型数据融合多 元校正模型中具有史高的权重,反Z亦然。使用这些权重的丨1标是使最终的叠加多元校正模 型的交叉检验错谋授小,也就是使其最稳健、最精确。以下的方程显示了权更优化过程: vtr= vtr= ARG ? 7 min (y - X w y )weR k=\ (1) 聘格式的:缩进:首行缩进:0字共中,ARGmin() ?衣示使括号屮变駅最小,必是第k个子多元校正模型(PLS和PCR)的? 预测值,叫是第k个权重用来從加第k 聘格式的:缩进:首行缩进:0字 叫=£/曲 (2) 需格式的:缩近首行缩进: 需格式的:缩近首行缩进:0字 其中,$k是第代个子多元校正模型交叉检验错误的倒数。 ■ 还存另列此外,亠种沁还可利用一个川以移动的灵活的窗口把鱼谱光谱数搦分成n等 分。窗口的探度取决丁与所要讲行名元校正分析的目标成分的谱峰的富度(例如60nm,即 30个变屋)性质口接相关。窗口的屮心以波长(10个变吊)的宽度从红外色谱 沁数踞的开始移动到结束匕把色谱沁数据分成n个部分。其后的多元校正过程如前所述。 这种算法称Z为屋加移动窗口多元校正分析,包含Stacked moving window PCR (SMWPCR) 和 Stack

文档评论(0)

ggkkppp + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档