暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

DSE精选文章|糖尿病眼病分类识别中的图像预处理

CCF数据库专委 2022-06-14
332

DSE精选文章

糖尿病眼病分类识别中的图像预处理

Image Preprocessing in Classification and Identification of Diabetic Eye Diseases


Data Science and Engineering (DSE)是由中国计算机学会(CCF)主办,数据库专业委员会承办,施普林格·自然(Springer Nature)集团出版的开放获取(OA)期刊。本篇文章精选自DSE第6卷第4期发文,得到中新赛克赞助文章处理费。




文章介绍



糖尿病眼病 (DED) 是一类影响糖尿病患者眼睛的疾病。早期诊断和治疗DED可以最大限度地减少视力障碍的风险,其中视网膜眼底图像在早期DED分类和识别中起着重要作用,是诊断该疾病最常用的方法。利用视网膜眼底图像构建准确的诊断模型在很大程度上取决于图像的质量和数量。因此,文章就图像处理对DED分类的重要性进行了系统研究,提出DED自动分类框架是通过以下几个步骤实现的:图像质量增强、图像分割(感兴趣区域)、图像增强(几何变换)和分类。利用传统的图像处理方法,采用新的卷积神经网络(CNN)架构,得到了最优结果。实验流程如图1所示。该文对早期DED诊断的贡献可分为以下几点:

(1)图像增强:采用绿色通道提取,对比限制自适应直方图均衡化(CLAHE),利用照明校正方法对原始图像进行增强;

(2)图像分割:从视网膜眼底图像中分割出感兴趣区域(ROI),如血管、黄斑区和视神经;

(3)预训练模型:选择高性能模型对经过处理和分割的眼底图像进行分类;

(4)构建新的CNN模型,利用经过处理和分割的视网膜眼底图像从头开始训练模型。


图1. 实验流程




实验效果



该文所有实验均使用MatLab、Python、Keras library1、TensorFlow2作为后端,利用Python 3.8编程语言实现。实验所用数据来自现有公开数据集,包含Mesidor、Mesidor-2、DRISHTI-GS和GitHub的视网膜数据集。该文比较分析了三种不同的预训练深度学习模型与新构建的CNN模型的性能准确性。


表1 ImageNet上预先训练的三个CNN模型及其特点

*top-1和top-5精度是指模型在ImageNet验证数据集上的性能。
**深度是指网络的拓扑深度,包括激活层、批量归一化层等。


表1展示了三个预训练模型Xception、VGG16、DenseNet21和五层卷积模型在测试数据集准确性方面的评估。本研究的预训练模型采用ImageNet数据集进行训练和测试。


表2 在原始图像上模型的平均性能

(粗体值表示VGG16分类超过了其他两个经过充分训练的深度学习模型)


表3 VGG16模型在预处理图像上的平均性能


表2和表3显示了现已有的Xception、VGG16、DenseNet21模型的最终输出,用于准确率比较。VGG16分类超过了另外两个充分训练的深度学习模型Xception和DenseNet121。


表4 新的CNN模型在原始图像上的平均性能


表5 新的CNN模型在预处理图像上的平均性能


文章构建了一种新的CNN模型来训练预处理的眼底图像,以提高分类精度。在所提出的系统中,文章对每个阶段采用了多种传统图像分割算法的组合。所有算法在感兴趣区域的分割中都提供了有效的结果。文章通过多个流程来构建一个高性能的系统,如图像增强、血管分割、视盘识别和提取、黄斑区域提取、血管移除、视盘消除、特征提取和特征分类。分割后,根据每个网络的输入规格,将图像优化为合适的大小。为了使模型过度拟合的风险最小化,使用Keras中的ImageDataGenerator类对不平衡数据集进行了增强。在消除和再训练n层(n层依赖于CNN)后,对预训练模型进行微调。在所有预训练模型中,使用预处理的视网膜图像所构建的新CNN模型比其他模型表现更好。表4和表5比较了结果的准确性,验证了所构建的CNN模型的准确性超过了用于分类的所有模型。


为了检测视网膜异常,该文还构建了更通用的筛查分类模型。图2、3、4展示了该模型检测DED疾病(糖尿病视网膜病变、糖尿病性黄斑水肿、青光眼)状态二元分类结果,其中包含混淆矩阵和ROC曲线。


图2 构建的CNN模型在糖尿病视网膜病变中的表现


图3 构建的CNN模型在糖尿病性黄斑水肿中的表现


图4 构建的CNN模型在青光眼中的表现




结语



该文提出了一种着重于识别正常情况下轻度DED的方法。通过对深度学习技术的研究分析,该模型采用了多种性能优化技术,如图像增强、特征增强、数据平衡和微调。深度学习的其他优势在于其自动识别能力,这种能力在类别之间最具有选择性。上述处理可以通过手动提取特征的分析方法(有时是主观方法)避免技术限制。此外,该文通过使用不同来源的复合数据集进行实验分析,以确保系统的稳健性及其对真实场景的响应能力。所开发的系统实现了劳动密集型眼睛筛查流程的标准化,并满足作为辅助诊断参考的要求,同时避免了人为主观性。




作者简介




Rubina Sarki在韩国科技大学获得人机交互和机器人技术硕士学位。目前正在澳大利亚维多利亚大学攻读计算机科学博士学位。她曾在韩国科学技术研究院(KIST)担任研究员。研究兴趣包括自动化疾病分类和检测系统的开发、深度学习、数据分析、图像分析、机器学习和自动化疾病检测系统。



Khandakar Ahmed在英国雷丁大学获得网络和电子商务计算(NeBCC)硕士学位。在西班牙马德里卡洛斯三世大学以及澳大利亚皇家墨尔本理工大学获得博士学位。研究方向包括物联网、智能城市、机器学习、网络安全和健康信息学等。



王桦,2004年获得南昆士兰大学 (USQ) 计算机科学学士学位。2011年至2013年担任南昆士兰大学教授。他目前是维多利亚大学应用信息学中心的全职教授。主要研究方向包括人工智能、数据分析、数据挖掘、访问控制、隐私和 Web 服务,以及它们在电子健康和电子环境领域的应用。



张彦春教授目前是广州大学/鹏城实验室特聘教授,澳大利亚维多利亚大学名誉教授。多年来一直从事社会计算和电子健康,大数据与AI算法与应用研究工作,在信息技术及医学领域发表国际期刊和学术会议文400余篇。已经出版,编辑书刊和专辑20余部,完成指导相关方向40多名博士生和博士后。




Jiangang Ma现任澳大利亚联邦大学工程、信息技术和物理科学学院信息技术讲师。在加入澳大利亚联邦大学之前,马博士曾在詹姆斯库克大学担任数据科学与统计学讲师。马博士在信息技术领域的研究兴趣包括数据科学、算法设计、人工智能、图像/视频处理、物联网(IoT)和健康信息学。



Kate Wang现任澳大利亚皇家墨尔本理工大学讲师。王博士的研究兴趣包括优化临床结果、药物优化和安全、数字健康或电子健康。



期刊简介




Data Science and Engineering(DSE)是由中国计算机学会(CCF)主办、数据库专业委员会承办、施普林格自然(Springer Nature)出版的Open Access期刊。为了迎合相关领域的快速发展需求,DSE致力于出版所有和数据科学与工程领域相关的关键科学问题与前沿研究热点,以大数据作为研究重点,征稿范畴主要包括4方面:(1)数据本身,(2)数据信息提取方法,(3)数据计算理论,和(4)用来分析与管理数据的技术和系统。

目前期刊已被EI、ESCI与SCOPUS收录,CiteScore 2021为6.4,在Computer Science Applications领域排名# 157/747(位列前21%)。稿件处理费由赞助商中新赛克(Sinovatio)承担,欢迎大家免费下载阅读期刊全文,并积极投稿。



原文链接:

https://link.springer.com/article/10.1007/s41019-021-00167-z




文章转载自CCF数据库专委,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论