在 chest X-ray 数据集上做肺分割
介绍
在此任务中,您将开发一个系统,可以在胸部X光片中自动检测肺部的边界框。
对于这项任务,我们将使用一个名为[Yolo]的网络(https://arxiv.org/pdf/1506.02640.pdf) 。有关YOLO(以及最新的YOLOv2 / YOLO9000)方法的详细信息,请参阅以下文章:
YOLO:统一的实时物体检测[https://arxiv.org/abs/1506.02640]
YOLO9000:更好,更快,更强[https://arxiv.org/abs/1612.08242]
胸部X光片是医学中最见的医疗影像。胸部X光片使用非常小剂量的χ射线来产生胸部的图像。它用于评估肺部,心脏和胸壁,可用于帮助诊断呼吸短促,持续性咳嗽,发烧,胸痛或受伤。它还可用于帮助诊断和监测各种肺病的治疗,如肺炎,肺气肿和癌症。由于胸部X光检查快速简便,因此在紧急诊断和治疗中特别有用。
由于空气,软组织和骨骼之间密度的差异,肺部看起来比周围环境更暗。肺部较亮的区域可能表明存在病理。
任务目标
这项任务的目标是熟悉YOLO架构,损失函数和训练过程,以及它产生的输出类型以及如何在边界框的实际预测中对其进行转换。此外,您将熟悉在胸部X射线中检测肺部的问题,并且将来可以重新训练使用的体系结构以检测胸部X射线图像中的更多解剖结构。
为了开始使用YOLO架构,我们为您提供预训练的YOLO网络,仅检测右肺,您将首先在某些图像上运行,然后重新训练以检测左右两侧肺部。
这项任务的2个主要任务是:
任务1:解码网络输出以显示右肺预测的边界框
任务2:在两肺上重新训练网络
数据
在此任务中使用的数据属于CHESTXRAY14 数据集,该数据集可公开获取,可在以下链接中找到:https://nihcc.app.box.com/v/ChestXray-NIHCC 。 由NIH发布的数据集包含112,120个30,805名不同患者的正面X射线图像,使用NLP方法在放射学报告中使用多达14种不同的胸部病理标签进行注释。
对于这项任务,我们从CHESTXRAY14中选择了13,331个胸部X射线图像,并生成了包含左肺和右肺的边界框。 边界框的坐标是从先前获得的肺部分割中提取的,可在我们的研究组中获得(CHESTXARY14数据集中没有肺部分割),如以下示例所示:
chest x-ray image lung segmentation bounding box
边界框数据采用xml格式,这是我们将在此分配中使用的YOLO训练脚本读取的格式(在下一个单元格中有关此内容的更多详细信息)。
用于图像“00000004_000的右肺和左肺边界框的xml文件内容示例如下:
<annotation verified="no">
<folder>Lungs</folder>
<filename>00000004_000</filename>
<source>
<database>Unknown</database>
</source>
<size>
<width>512</width>
<height>512</height>
<depth>1</depth>
</size>
<segmented>0</segmented>
<object>
<name>RL</name>
<pose>Unspecified</pose>
<truncated>0</truncated>
<difficult>0</difficult>
<bndbox>
<xmin>64</xmin>
<ymin>62</ymin>
<xmax>256</xmax>
<ymax>490</ymax>
</bndbox>
</object>
<object>
<name>LL</name>
<pose>Unspecified</pose>
<truncated>0</truncated>
<difficult>0</difficult>
<bndbox>
<xmin>298</xmin>
<ymin>78</ymin>
<xmax>450</xmax>
<ymax>502</ymax>
</bndbox>
</object>
</annotation>




