基于SVM的高不平衡分类技术研究及其在电信业的应用-控制科学与工程专业论文.docxVIP

基于SVM的高不平衡分类技术研究及其在电信业的应用-控制科学与工程专业论文.docx

  1. 1、本文档共186页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于SVM的高不平衡分类技术研究及其在电信业的应用-控制科学与工程专业论文

啊Research on SVMbased Hh!hlv Imbalanced Classification and its ADolication in Telecommunications Authors signature: Supervisors signature: Extemal Reviewers: Examining Committee Chairperson: Wanliang Wang飞Professor Examining Committee Members: Jing Zhu\Professor ShUQing Wang\Professor Gang Ron且.\Professor Jun Wu\Professor Date of oral defence: Seotember 14飞2010 浙江大学研究生学位论文独创性声明 本人声 1月所呈交的学位论文是本人在导归指导节进行的研究工作及取得的 研究成果.除了文中特别加以标泣如致谢的地方外,论文中不包含其他人已经发 表或撰写过的研究成果,也不包含为获得浙江大学或其他教育机构的学位或 证书而使用过的材料.与我一同工样的到志对本研究所做的任何贡献均已在论文 中作了研确的说明并表示谢意. I I j、.f: j 学位论文作者签名:冻刑 签字叫:州年 7 }1 IS 目 学位论文版权使用授权书 本学位论文作者完全了解 浙江大学 有权保留并向国家有关部门或机 构送交本论文的复印件和磁盘,允许论文被查阅和借阅.本人授权浙江大学 可以将学位论文的全部或部分内容编入有关数据库进行检索和传播,可以采用影 印、缩印或扫描等复制手段保存、汇编学位论文. (必威体育官网网址的学位论文在解密后适用本授权书) 1. 1)... J学位论文作者签名:P.í牛 ?.却1l 导师签名: J 签字叫: ìtJ(fJ 年 7 月 6日 签字日期 摘要 SVM(Support Vector Machine)是基于统计学习理论的学习机器,在分类问题 的处理中具有优秀的性能。不平衡分类问题是数据挖掘和机器学习领域的一个重 要研究方向,并且在实际商业应用中不平衡数据集往往具有高不平衡程度、严重 的类重叠和噪声、高维、海最以及涉及离不平衡多分类问题等特点,对分类器的 分类性能造成极大影响。论文从实际电信商业智能问题出发,旨在解决 SVM 在 不平衡分类中的不足,提出更为有效的解决方法,使 SVM 能够适用于具有高不 平衡特性的商业智能应用。通过 Benchm盯k 数据集和实际电信数据集中的仿真 实验验证了所提出方法的有效性和优越性。在上述研究结果的基础上,论文设计 并实现了电信业公众客户防欠费欺诈商业智能系统和电信防欠费欺诈智能催缴 派单系统,同时结合实际数据挖掘项目经验,提出一个针对电信行业的数据挖掘 方法论。 论文的主要研究内容如下: 1. 针对离不平衡程度和类重叠问时存在于数据分布时分类困难的问题,提 出 SVM-HIO(SVM modeling for Highly Imbalanced and Overlapping classification)算法。 SVM-HIO 算法采用分类超平面偏移策略使得能够在 某个特征空间识别出非重叠样本并训练元模型:通过核空间轮换策略, SVMHIO 算法在多个核空间进行学习,进而能够识别出更多特征空间 的非熏费样本:利用元模型的结合最终 SVM-HIO 算法建立一个非线性 模型而不是之前 SVM 的线性模型,建立的非线性模型能够将全部少数 类预测出,同时保证多数类的误分代价最小。 11. 针对现有离不平衡多分类算法,少数类的分类性能和识别能力较差的问 题,提出一种二叉树树结构建立标准蝴基于不平衡度的类问可分离性,在 此基础上提出一种基于二叉树的 SVM 离不平衡多分类算法 MCI-SVM(Multi-Classification based highly Imbalanced SVM)。在多分类 建模中, MCI-SVM 算法基于少数类的重要程度,问时结合类问可分离 性的思想,首先识别多分类问题中的重要类簇,降低重要类别的误差累 积;在多数类簇和少数类簇的建模节点,利用代价敏感学习策略减少由 于离不平衡性引起的分类性能降低;问时,在各个簇中将分离性高的类 别优先分离。提出的 MCI-SVM 算法在保证总体分类性能的同时,能够 减少少数类的推广误差,并显著提高少数类的识别能力。 III. 针对在海最高不平衡分类中传统学习算法无法在有效时间内建立模型 以及高不平衡会导致较差模型精度和少数类识别能力的问题,提出一种 基于( 1句)近似最小包裹球

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档