DSE精选文章
糖尿病眼病分类识别中的图像预处理
Image Preprocessing in Classification and Identification of Diabetic Eye Diseases
文章介绍
糖尿病眼病 (DED) 是一类影响糖尿病患者眼睛的疾病。早期诊断和治疗DED可以最大限度地减少视力障碍的风险,其中视网膜眼底图像在早期DED分类和识别中起着重要作用,是诊断该疾病最常用的方法。利用视网膜眼底图像构建准确的诊断模型在很大程度上取决于图像的质量和数量。因此,文章就图像处理对DED分类的重要性进行了系统研究,提出DED自动分类框架是通过以下几个步骤实现的:图像质量增强、图像分割(感兴趣区域)、图像增强(几何变换)和分类。利用传统的图像处理方法,采用新的卷积神经网络(CNN)架构,得到了最优结果。实验流程如图1所示。该文对早期DED诊断的贡献可分为以下几点:
(1)图像增强:采用绿色通道提取,对比限制自适应直方图均衡化(CLAHE),利用照明校正方法对原始图像进行增强;
(2)图像分割:从视网膜眼底图像中分割出感兴趣区域(ROI),如血管、黄斑区和视神经;
(3)预训练模型:选择高性能模型对经过处理和分割的眼底图像进行分类;
(4)构建新的CNN模型,利用经过处理和分割的视网膜眼底图像从头开始训练模型。

图1. 实验流程
实验效果
该文所有实验均使用MatLab、Python、Keras library1、TensorFlow2作为后端,利用Python 3.8编程语言实现。实验所用数据来自现有公开数据集,包含Mesidor、Mesidor-2、DRISHTI-GS和GitHub的视网膜数据集。该文比较分析了三种不同的预训练深度学习模型与新构建的CNN模型的性能准确性。
表1 ImageNet上预先训练的三个CNN模型及其特点

表1展示了三个预训练模型Xception、VGG16、DenseNet21和五层卷积模型在测试数据集准确性方面的评估。本研究的预训练模型采用ImageNet数据集进行训练和测试。
表2 在原始图像上模型的平均性能

(粗体值表示VGG16分类超过了其他两个经过充分训练的深度学习模型)
表3 VGG16模型在预处理图像上的平均性能

表2和表3显示了现已有的Xception、VGG16、DenseNet21模型的最终输出,用于准确率比较。VGG16分类超过了另外两个充分训练的深度学习模型Xception和DenseNet121。
表4 新的CNN模型在原始图像上的平均性能

表5 新的CNN模型在预处理图像上的平均性能

文章构建了一种新的CNN模型来训练预处理的眼底图像,以提高分类精度。在所提出的系统中,文章对每个阶段采用了多种传统图像分割算法的组合。所有算法在感兴趣区域的分割中都提供了有效的结果。文章通过多个流程来构建一个高性能的系统,如图像增强、血管分割、视盘识别和提取、黄斑区域提取、血管移除、视盘消除、特征提取和特征分类。分割后,根据每个网络的输入规格,将图像优化为合适的大小。为了使模型过度拟合的风险最小化,使用Keras中的ImageDataGenerator类对不平衡数据集进行了增强。在消除和再训练n层(n层依赖于CNN)后,对预训练模型进行微调。在所有预训练模型中,使用预处理的视网膜图像所构建的新CNN模型比其他模型表现更好。表4和表5比较了结果的准确性,验证了所构建的CNN模型的准确性超过了用于分类的所有模型。
为了检测视网膜异常,该文还构建了更通用的筛查分类模型。图2、3、4展示了该模型检测DED疾病(糖尿病视网膜病变、糖尿病性黄斑水肿、青光眼)状态二元分类结果,其中包含混淆矩阵和ROC曲线。

图2 构建的CNN模型在糖尿病视网膜病变中的表现

图3 构建的CNN模型在糖尿病性黄斑水肿中的表现

图4 构建的CNN模型在青光眼中的表现
结语
该文提出了一种着重于识别正常情况下轻度DED的方法。通过对深度学习技术的研究分析,该模型采用了多种性能优化技术,如图像增强、特征增强、数据平衡和微调。深度学习的其他优势在于其自动识别能力,这种能力在类别之间最具有选择性。上述处理可以通过手动提取特征的分析方法(有时是主观方法)避免技术限制。此外,该文通过使用不同来源的复合数据集进行实验分析,以确保系统的稳健性及其对真实场景的响应能力。所开发的系统实现了劳动密集型眼睛筛查流程的标准化,并满足作为辅助诊断参考的要求,同时避免了人为主观性。
作者简介
期刊简介













