- 1、本文档共13页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
基于Attention机制的U-net的眼底渗出液分割
摘要:糖尿病视网膜病变(DR)是一种严重的眼部异常,其严重情况下会导致视网膜脱落甚至失明。眼底的渗出液是由于高血糖毒性作用,导致血屏障破坏,血管内的脂质等漏出而造成的。是视网膜病变的并发症之一。由于患者与专业医生数量悬殊巨大,设计一个可以自动的检测渗出液的医疗助手是十分重要的任务。本文依托于深度学习方法,以U-Net架构为骨架网络,以准确度(Acc)、灵敏度(SE)、特异性(SP)以及AUC值作为模型性能的评估指标,先测试了原始U-Net在该任务上的分割能力,在该任务上达到99.8%的准确度,73.1%的灵敏度,98.0%的特异性以及0.973的AUC值。根据U-Net网络架构的固有问题,将Attention机制与U-Net结构,搭建AttentionU-Net。99.8%的准确度,81.5%的灵敏度,99.8%的特异性以及0.985的AUC值。实验结果表明,AttentionU-Net有更好的特征提取能力。
关键词:视网膜病变;深度学习;AttentionU-Net;硬渗出液分割
1引言
糖尿病视网膜病变(DR)是一种严重的眼部异常,这种病变与慢性糖尿病相关,是糖尿病最常见的微血管病症之一,是慢性糖尿病导致的视网膜微血管渗漏和阻塞而引起的一系列的眼底病变,有微血管瘤、硬性渗出甚至视网膜脱落等等表现。患有它的患者可能会逐渐失去视力,甚至造成失明[1]。近年来,随着医学水平的不断提高,糖尿病视网膜病变(DR)可以通过及时诊断和干预来治疗,但是视力障碍的病变和症状很容易在疾病的早期阶段被忽视,这会导致之后治疗的成本和风险大大提高。与之应对的措施之一就是安排糖尿病患者进行定期检查以延迟或减轻失明的风险。但是,由于医护数量有限,且具有经验的临床医生目前远远不足以进行不间断的诊断庞大的糖尿病患者群体,截至目前,全球有超过4亿糖尿病患者。若想完成对每一位患者的周期性检查,几乎是不可能完成的。因此需要开发一种自动诊断技术帮助医学专家减轻负担,在保证检测效率的前提下提高精度。
硬性渗出液是糖尿病视网膜病变的并发症之一。由于高血糖毒性作用,血屏障被破坏,血管内的脂质、蛋白成分漏到视网膜上,留下黄色的点状深处。图1.1为眼底硬性渗出液的示意图。如图1所示,红色框内部的点状异常为眼底渗出液。需要解决的问题就是将该区域的特征有效的提取出来,输出一个二值图片。
图1眼底渗出液示意图
实现眼底图像分割的方法具有两大方向[2-3]。一个方向是基于传统的机器学习以及机器视觉的方法。Fleming等人采用SVM的方法实现了对渗出液的分割[4]。他们首先使用均值和高斯滤波器对RGB图像的绿色通道进行矫正。采用多种线性结构元素用来检测渗出液的区域。最后检测到的区域使用SVM分类器将渗出液区域和背景区域分割出来。除此以外,Sopharak用朴素贝叶斯分类器实现了该任务[5]。Osareh等人用FCM的方法,实现了对渗出液位置的像素级精准定位[6]。传统机器学习的方法需要对问题进行特殊的定制,且泛化能力受算法限制,操作过程繁杂,具体问题需要具体分析。随着深度学习技术的发展以及GPU运算的速度持续加快,以神经网络为代表的图像分割方式逐渐完善。Gardner等人首次使用反向传播的神经网络来检测眼底渗出液[7]。深度学习发展后,模型对于大样本的需求很高。但在医学领域,病症图片的样本十分稀少。为了解决小样本的预测问题,OlafRonneberger等人提出了U-net[8]。U-net基于卷积神经网络搭建而成,卷积层的运算具有高并行性,且由于权值共享的机制拥有很少的参数量,却有很强的空间特征提取能力。
本文基于U-net的架构,利用深度学习的方法将数据集分为训练集和测试集。经过数据预处理和网络训练调试,网络可以达到较好的预测结果。
2方法
2.1数据
由于e-ophtha数据集中仅有47个标注数据,且数据的特征属于正负样本不均衡问题,为了扩充数据集,采用了两个方法。首先,进一步加入IDRiD官方的分割数据集。选用分割数据集中的硬分割数据。观察IDRiD的数据集可以发现,数据集中的标签格式为TIF格式,且图片中的渗出液用红色作为标注。为了与e-ophtha数据集的标注数据统一,则将其转化为黑白二值图像以及相同的图片格式。
接下来进行数据集的扩充和增强。在实验过程中,一共采用了两种方式。
第一种,单独对e-ophtha数据集进行处理,对单个图片切割成很多patches。首先将图片进行中心裁剪为960×960的图片,去掉大部分不感兴趣的区域。再将图片resize到512×512。之后对单个图片进行切割,尝试了32×32、64×64、128×128三种不同的patch。40张图片作为训练集,
文档评论(0)