面向不确定性数据若干分类算法地研究论文.docx

面向不确定性数据若干分类算法地研究论文.docx

  1. 1、本文档共69页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
江西理工大学硕士学位论文 独创性声明学位论文独创性声明本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含已获得江西理工大学或其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说明并表示谢意。申请学位论文与资料若有不实之处,本人承担一切相关责任。研究生签名:时间:年月日学位论文版权使用授权书本人完全了解江西理工大学关于收集、保存、使用学位论文的规定:即学校有权保存按要求提交的学位论文印刷本和电子版本,学校有权将将学文论文的全部或者部分内容编入有关数据库进行检索,并采用影印、缩印或扫描等复制手段保存、汇编以供查阅和借阅;学校有权按有关规定向国家有关部门或者机构送交论文的复印件和电子版。本人允许本学位论文被查阅和借阅,同意学校向国家有关部门或机构送交论文的复印件和电子版,并通过网络向社会公众提供信息服务。必威体育官网网址的学位论文在解密后适用本授权书学位论文作者签名(手写):导师签名(手写):签字日期:年 月日签字日期:年月日万方数据江西理工大学硕士学位论文 摘要摘要数据的不确定性广泛存在于互联网、通信、经济、信息安全等领域中。在数据挖掘领域,传统的挖掘方法主要是针对精确数据提出的,其挖掘模型未考虑数据的不确定性信息,从而不能直接用于处理不确定性数据。数据的不确定性是待挖掘对象不可忽视的客观属性,对挖掘结果的质量有着重要的影响。针对不确定性数据的挖掘方法也因此成为学术界前沿研究领域之一。针对区间不确定性数据分类问题,由于每种分类方法在不同问题上都有各自的优缺点,为此本文针对支持向量机、朴素贝叶斯和决策树三种分类方法,从数据模型的建立、分类模型的改进设计等几个方面进行了研究,主要工作和成果如下:(1)提出了基于支持向量机的区间不确定性数据分类方法针对区间不确定性数据,构建了不确定性数据的超椭球凸集模型,将该数据模型引入到标准的 SVM 和 HSVM 分类模型中,分别提出了不确定性支持向量机(IUSVM)和不确定性超球支持向量机(IUHSVM)两种分类方法。然后,通过上下两层子规划交替迭代寻优的方式对 IUSVM 和 IUHSVM 的不确定约束规划问题进行求解,并进一步通过推导得到下层子规划最优解的数学公式,有效提高计算效率。最后,从算法有效性、分类精度、运行时间等三个方面进行仿真对比实验。实验结果表明:IUSVM 和 IUHSVM 算法能有效描述数据的不确定性信息,且又保持 SVM 较好的鲁棒性。(2)提出了基于朴素贝叶斯的区间不确定性数据分类方法针对区间不确定性数据,构建了基于随机理论的不确定性数据模型,分别提出了基于直方图估计的不确定性朴素贝叶斯分类方法(IU-HNBC)和基于改进 Parzen 窗估计的不确定性朴素贝叶斯分类方法(IU-PNBC)。IU-HNBC 算法采用直方图估计区间不确定性数据的类条件概率密度函数,将区间数据划分到不同的直方图区间,并给出落入各区间的概率及计算公式。最后,从直方图区间个数选择、算法分类精度、运行时间等三个方面进行仿真对比实验。实验结果表明:同现有不确定性朴素贝叶斯方法相比,IU-HNBC 算法计算复杂度低,时间效率高,具有更好的分类精度和分类稳定性。IU-PNBC 算法基于期望思想,采用 Parzen 估计法推导出不确定性数据类条件概率密度函数的数学计算公式,并通过其代数插值函数预测未知类别样本的后验概率,从而将 Parzen 窗估计转化为非惰性方法,降低了计算复杂度。最后,从插值点个数选择、算法分类精度、运行时间等方面进行仿真对比试验。实验结果表明:随着插值点增多,IUPNBC 算法分类精度也提高,插值点数高于 15 时,分类结果趋于稳定。IU-PNBC 算法拥有较优的分类精度、较小的时间代价和空间需求。I万方数据江西理工大学硕士学位论文 摘要(3)提出了基于决策树的区间不确定性数据分类方法针对区间不确定性数据,考虑决策树对连续属性存在信息表达能力弱的不足,提出一种基于模糊决策树的区间不确定性数据分类方法(IU-FDT)。首先,基于随机理论,假设不确定性数据满足均匀分布,并定义了区间不确定性数据之间的距离度量函数,对区间样本的各维属性分别进行模糊聚类,从而将区间不确定性转换为以隶属度形式表示的模糊不确定性,并采用 FDT 方法对转化后的样本进行分类。最后,从算法分类精度、运行时间等方面进行了对比实验。实验结果表明:IU-FDT 方法能有效克服不确定性信息的干扰,同不确定性数据的支持向量机方法相比,IU-FDT 方法具有更高的时间效率;同不确定性数据的朴素贝叶斯方法相比,IU-FDT 方法的分类精度具有更好的稳定性。关键词:区间不确定性

文档评论(0)

tkhyxy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档