- 1、本文档共71页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中文摘要
摘 要
人工嗅觉系统(电子鼻)是一种基于人工智能算法的气味检测装置。在该装
置普及过程中,解决在线连续工作条件下的漂移问题显得尤为重要。综合考虑可
行性和校正样本特点,本文选取主动学习作为电子鼻在线漂移校正方法的基本框
架。在此框架下,由于漂移校正样本取自已出现的在线样本,其样本类别存在随
机性,故极易出现“类不均衡”问题。本文围绕这一问题,展开了两方面的研究
工作。
第一,为提高主动学习框架中“少类”样本的漂移校正效果,本文提出了一
种改进型的主动学习样本选择方法——基于咨询委员会的类均衡方法(Query By
Committee for Balancing Classes,QBCBC )。QBCBC 着力于挑选出对 “少类”样
本分类更为关键的样本并对其进行标记,以综合提高校正后分类器对各类别漂移
样本的识别能力。QBCBC 以“咨询委员会”策略为基础,对当前有标记训练集进
行自助采样,构建两个集成分类器的委员会成员,采用“最大投票分歧”准则挑
选样本。针对校正数据集可能出现的类不均衡问题,选择委员会成员中与稀缺类
相关的子分类器输出结果,找到具有最大分歧的样本进行标注,目的是尽可能挑
到位于分类边界的稀缺类样本,使在线生成的校正样本集趋于类信息均衡。实验
结果表明QBCBC 具有综合提升分类器在全类别样本上的识别正确率。此外,当参
考类不均衡比率设置在1.2 至2 之间时,该方法能够起到明显效果,提高整体正确
率(G-mean )7% 。
第二,针对设备存储资源有限与主动学习中校正样本无限增加的矛盾,本文
提出了一种基于函数拟合的校正样本“归纳-重建”方法(Inducting-Rebuilding on
Function Fitting,IRFF )。IRFF 首先通过主动学习在线获取带标记的校正样本并
用高斯函数对校正样本信息进行拟合和归纳。当需要进行校正时,可由拟合后的
高斯函数重建各类校正样本。由于重建的校正样本数量不受真实样本数量的限制,
因此使用IRFF 可以避免校正样本发生类不均衡问题。此外,在“归纳”过程中将
样本信息转换为高斯分布参数(均值和方差),达到了压缩校正样本存储空间的
目的。实验结果表明,IRFF 以一定分类识别率为代价,降低了对于校正样本存储
空间的需求。对于本文所采用的电子鼻漂移数据集,当重建样本数量保持在10 到
60 个时,样本存储空间压缩比可达到 27 :1 左右,对所有测试集的平均 G-mean
保持在0.75 左右。
本文将主动学习的理论和方法引入到电子鼻漂移抑制工作中,针对校正样本
I
重庆大学硕士学位论文
不均衡和存储空间有限问题,分别提出了基于样本选择策略和函数拟合的解决方
法。本文的工作为进一步研究人工嗅觉系统的在线漂移抑制方法奠定了基础。
关键词:人工嗅觉系统;类不均衡学习;主动学习;函数拟合
II
英文摘要
Abstract
Artificial olfactory system (electronic nose) is an odor-detection device based on
artificial intelligence algorithm. In the popularization process of the device, it is
particularly important to solve the drift problem under the on-line continuous conditions.
Considering the feasibility and characteristics of calibration samples, active learning is
chosen as the basic framework of online drift cali
文档评论(0)