计算机视觉应用--模型训练与评估.pptx

下载文档

0
0
约3.62千字
约 28页
2025-03-01 发布于四川
举报
版权申诉
保障服务

计算机视觉应用--模型训练与评估.pptx

1、本文档共28页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

模型训练与评估8.3

8.3.1数据集介绍8.3模型训练与评估在图像数据集方面,我们使用了PASCALVOC的语义分割基准数据集。PASCALVOC是常用的训练和评价语义分割算法性能的数据集,基本上已经成了综合评估新的语义分割算法的基准数据集。它包含20个前景对象类和1个背景类,总共21个语义分类,如图8-14所示。原始数据集包含1464张训练图像、1449张验证图像、1456张测试图像,且大小均为513×513。在此基础上,Hariharan等人对PASCALVOC数据集进行了改进,提供了额外的像素级标注,使数据集拥有10582张训练图像,本文使用这些图像来训练测试网络模型。

8.3模型训练与评估

VOC数据集的文件夹结构如图8-15所示。8.3模型训练与评估

Annotations中包含了对应图片的xml信息,xml信息包含了该图片的基本信息,xml语言很易读,从一张图片的xml文件中可以轻易得出这幅图片的一些基本信息。如果segmented一栏为1,意味着这幅图用于分割(因为VOC2012中共有上万张图片,但并不都用于分割任务,有的用于目标检测或动作识别等);若这一栏为0,则意味着这幅图不是用于图像分割的。ImageSets中有用的部分为Segmentation文件,其中有用于标记分割任务图像信息的txt文件,包括train.txt和val.txt文件。图8-16所示为ImageSets目录结构。JPEGimages中则存放了数据集的原图片,这些图片一共有17125张,但并不是都使用,仅对train.txt和val.txt文件中列出的图像进行分割任务时使用,而其他图像则用于不同的任务中。SegmentationClass文件夹存放的是按照类别分割的图像。每个类别都对应着其特定的颜色。SegmentationObject文件夹存放的是按照物体分割的图像。每个物体都对应着其特定的颜色。8.3模型训练与评估

8.3模型训练与评估

8.3.2网络训练将下载好的VOC数据集放到项目文件的根目录下,运行train.py文件进行训练。网络训练的具体代码如下:8.3模型训练与评估

8.3模型训练与评估

8.3.3训练参数解析在上述网络训练(train.py)中有大量训练参数和命令的设置,为了方便对网络训练过程的理解,下面对这些训练参数进行解析说明。(1)Cuda。Cuda=True表示使用Cuda,若没有GPU,则可以将其设置为False。(2)num_classes=21,需要的分类个数+1(背景)。(3)backbone=mobilenet,所使用的主干网络:mobilenet、xception。(4)model_path=model_data/deeplab_mobilenetv2.pth,加载预训练权重,数据的预训练权重对不同数据集是通用的,因为特征是通用的。预训练权重对于99%的情况都必须要用,不用的话权值太过随机,特征提取效果不明显,网络训练的结果也不会好。如果想要断点续练,就将model_path设置成logs文件夹下已经训练的权值文件。8.3模型训练与评估

(5)downsample_factor=16,下采样的倍数8、16,8要求更大的显存。(6)input_shape=[512,512],输入图片的大小。(7)训练分为两个阶段,分别是冻结阶段和解冻阶段。①冻结阶段训练参数。此时模型的主干被冻结了,特征提取网络不发生改变,占用的显存较小,仅对网络进行微调。Init_Epoch=0Freeze_Epoch=50Freeze_batch_size=8Freeze_lr=5e-48.3模型训练与评估

②解冻阶段训练参数。此时模型的主干不被冻结了,特征提取网络会发生改变,占用的显存较大,网络所有的参数都会发生改变。UnFreeze_Epoch=100UnFreeze_batch_size=4UnFreeze_lr=5e-5(8)VOCdevkit_path=?VOCdevkit?,数据集路径,默认指向根目录的数据集文件夹。(9)dice_loss=False。建议选项如下。①种类少(几类)时,设置为True。②种类多(十几类)时,如果batch_size比较大(10以上),那么设置为True。③种类多(十几类)时,如果batch_size比较小(10以下),那么设置为False。8.3模型训练与评估

(10)是否使用主干网络的预训练权重。此处使用的是主干的

您可能关注的文档

文档评论（0）

小刚 + 关注: 实名认证

内容提供者

教师资格证持证人

该用户很懒，什么也没介绍

咨询Ta 进入空间

领域认证该用户于2025年02月18日上传了教师资格证

1亿VIP精品文档

更多 >

计算机视觉应用--模型训练与评估.pptx