- 1、本文档共3页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于OC-SVM的大型数据集分类方法
ComputerEngineeringandApplications计算机工程与应用
基于OC.SVM 的大型数据集分类方法
张 瑜,罗 可
ZHANG Y_u,LUO Ke ‘
长沙理工大学 计算机与通信工程学院,长沙 410076
InstituteofComputerandCommunication Engineering,ChangshaUniversity ofScienceandTechnology,Chnagsha410076,China
ZHANG Yu.LUO Ke.OC—SVM —based classification for large-scale data sets.Computer Engineering and Applications,
2011.47(4):131—133.
Abstract:Support VectorMachine(SVM)isoneofthemosteffectiveclassifiers,whichhasveryhigh classificationaccura—
cy andgoodgeneralization abiliyt.However,SVM training yetisvery complicated forlarge—scaledatasets.A one—classSVM
(OC—SVM).basedclassification isproposed.Inthismethod,trainingsetsarereducedbytherandom selectionalgorithm to in-
crease training speed.Meanwhile,originaldata which are the neighbors ofsamples in hypersphere intersection are recovered
to ensureSVM classification accuracy.The experimentalresultsshow thatthe methodreducesthecomputationalcomplexiyt
atagreatextent,SO thetraining speed isimproved for large—scale datasets.
Keywords:One.ClassSupportVectorMachine(OC—SVM);random selection;SupportVectorMachine(SVM)classifica—
tion;large—scale daat sets
摘 要 :支持向量机是最有效的分类技术之一,具有很高的分类精度和 良好的泛化能力,但其应用于大型数据集时的训练过程还
是非常复杂。对此提 出了一种基于单类支持向量机的分类方法。采用随机选择算法来约简训练集,以达到提高训练速度的目
的;同时,通过恢复超球体交集中样本在原始数据中的邻域来保证支持向量机的分类精度。实验证明,该方法能在较大程度上减
小计算复杂度,从而提高大型数据集中的训练速度
关键词 :单类支持向量机;随机选择;支持向量机分类;大型数据集
DOI:10.3778~.issn.1002.8331.2011.04.036 文章编号:1002.8331(2011)04.0131-03 文献标识码:A 中图分类号:TP391
1 引言 算法采样后,用OC—SVM将样本映射到特征空间生成超球体 ,
分类是数据挖掘中的一个重要环节 ,主要的方法有基于 保留两球体交集中的样本,并恢复样本邻域中的原始数据,最
规则的最邻近分类 、贝叶斯分类、人工神经网络 、决策树、支持 后对交集中的数据进行支持向量机分类。实验证明,该方法
向量机 (SVM)等n。其中支持向量机是最有效的分类方法之 能在较大程度上减小计算复杂度 ,从而提高大型数据集中的
一 , 具有很高的分类精度和良好的泛化能力。但对大规模样 训练速度。
本集支持向量机的训练代价太高(如耗时太长 ,占用内存太大
等)。目前 ,研究这一问题的方法大致可以分为两类 :一类是 2 oC.SVM 原理
对支持向量机算法进行改进。如文献[2]利用最小
您可能关注的文档
最近下载
- 驷惠win系列l汽车管理系统说明书.doc
- GrokkingtheSystemDesignIntervi_电子版说明文档.pdf
- 《石油天然气钻采设备 自动化连续油管作业装备》-全文及说明.docx VIP
- 全国交管12123学法免分测试题附答案(通用版)605.doc
- 孕产妇知识培训.pptx VIP
- 全国新高考英语答题卡模板.docx VIP
- 新媒体视听节目制作 课件全套 第1--10章 新媒体时代导演的基本素养---节目的合成.pptx VIP
- 国际贸易实务英文版课件帅建林 ISBN9787810789561 PPT帅ch5.ppt
- 全国交管12123学法免分测试题附答案(通用版)607.doc
- 国际贸易实务英文版课件帅建林 ISBN9787810789561 PPT帅ch1 2 3 4.ppt VIP
文档评论(0)