- 1、本文档共17页,其中可免费阅读10页,需付费150金币后方可阅读剩余内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 4、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1.?? 引言
在分类任务中,数据不平衡是最为常见的问题之一.数据不平衡又称类不平衡,其中数据量较充裕的为多数类,反之为少数类.在不同场景下,多数类与少数类数量差别小到几个百分点,多到几个数量级,后者称为严重不平衡.如今,基于深度学习的分类器已经被运用到不同类别图像、音频、文字的识别工作中,并取得显著成果.但面对严重不平衡数据集时,如果训练数据不做任何预处理,模型可能在多数类数据识别中取得不错成绩,但在少数类数据验证中差强人意.当任务重心放在少数类识别上时,模型识别效果便亟待提升.类不平衡问题几乎分布在所有数据领域,如金融、医疗、生物等.
在模型训练过程中,多数类数据特征由于类别样本出现频率高
文档评论(0)