- 1、本文档共6页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章2-分类器的验证方法-20140925
分类器的验证方法 软件工程学院 郑皎凌 交叉验证(CrossValidation) CV是用来验证分类器的性能一种统计分析方法,基本思想是把在某种意义下将原始数据(dataset)进行分组,一部分做为训练集(train?set),另一部分做为验证集(validation?set),首先用训练集对分类器进行训练,再利用验证集来测试训练得到的模型(model),以此来做为评价分类器的性能指标. K-折交叉验证K-fold?Cross?Validation 将原始数据分成K组(一般是均分),将每个子集数据分别做一次验证集,其余的K-1组子集数据作为训练集,这样会得到K个模型,用这K个模型最终的验证集的分类准确率的平均数作为此K-CV下分类器的性能指标. K一般大于等于2,实际操作时一般从3开始取,只有在原始数据集合数据量小的时候才会尝试取2.K-CV可以有效的避免过学习以及欠学习状态的发生,最后得到的结果也比较具有说服性. 留一验证LOO-CV 如果设原始数据有N个样本,那么LOO-CV就是N-CV,即?每个样本单独作为验证集,其余的N-1个样本作为训练集,所以LOO-CV会得到N个模型,用这N个模型最终的验证集的分类准确率的平均数作为此下LOO-CV分类器的性能指标. LOO-CV的优点 相比于前面的K-CV,LOO-CV有两个明显的优点:?①a.每一回合中几乎所有的样本皆用于训练模型,因此最接近原始样本的分布,这样评估所得的结果比较可靠。?②b.实验过程中没有随机因素会影响实验数据,确保实验过程是可以被复制的。? LOO-CV的缺点 ?LOO-CV的缺点则是计算成本高,因为需要建立的模型数量与原始数据样本数量相同,当原始数据样本数量相当多时,LOO-CV在实作上便有困难几乎就是不显示,除非每次训练分类器得到模型的速度很快,或是可以用并行化计算减少计算所需的时间.?
您可能关注的文档
- 新世纪高职高专综合英语 2 unit 7.ppt
- Oracle ERP各模块之间表关系.ppt
- 国际交流英语视听说听力原文 电子版B3U3.pdf
- 国际评价条件.pptx
- 第8讲 Linux相关主题.pdf
- 金纳米棒与石墨烯复合.pdf
- 语言学 合作原则.ppt
- 无尘室管制阶段培训内容1.ppt
- struts2课件4-验证框架.ppt
- 安永咨询方法论_Lesson1.pdf
- 2025年中考语文写作专项复习:作文分类之考场议论文技法指导课件.pptx
- 6.19.3+植物的生殖方式课件2024-2025学年北师大版生物八年级上册.pptx
- 3.14丝绸之路的开通与经营西域+课件--2024-2025学年统编版七年级历史上册.pptx
- 3.15+秦汉时期的科技与文化++课件++2024-2025学年统编版七年级历史上册.pptx
- Unit 2 We’re FamilySection B 1a-2b课件-2024-2025学年鲁教版 五四制六年级英语上册.pptx
- 20.曹刿论战 第1课时.pptx
- +Unit5+Project++Reading+Plus课件++-+2024-2025学年人教版英语七年级上册.pptx
- 1.3+太平天国运动+课件--+2024-2025学年统编版八年级历史上册.pptx
- Module+10+Unit+1+It+might+snow+课件+2024-2025学年外研版英语八年级上册.pptx
- Unit7+ ?Section+B1a-1e课件+2024-2025学年人教版英语八年级上册+.pptx
文档评论(0)