赛题名称:UBC Ovarian Cancer Subtype Classification and Outlier Detection (UBC-OCEAN) 赛题任务:UBC 卵巢癌亚型分类和异常值检测 赛题类型:计算机视觉、图像分类 赛题链接👇:
https://www.kaggle.com/competitions/UBC-OCEAN/overview
比赛介绍
卵巢癌是女性生殖系统中最致命的癌症之一。它有五个常见的亚型:高级别浆液性癌、透明细胞卵巢癌、子宫内膜样癌、低级别浆液性癌和黏液性癌。此外,还有一些罕见的亚型("离群值")。所有这些亚型都具有明显的细胞形态、病因、分子和遗传特征以及临床属性。亚型特定的治疗方法逐渐崭露头角,但首先需要进行亚型鉴定,这个过程可以通过数据科学进行改进。

目前,卵巢癌的诊断依赖于病理学家来评估亚型。然而,这带来了一些挑战,包括观察者之间的分歧和诊断的可重复性。此外,一些未得到充分服务的社区通常缺乏专业病理学家,即使在发达社区中,也面临着专门研究妇科恶性肿瘤的病理学家短缺的问题。
深度学习模型在分析组织病理学图像方面表现出卓越的能力。然而,仍然存在挑战,比如需要大量的培训数据,最好来自单一来源。技术、伦理、财务约束以及保密方面的顾虑使培训变得具有挑战性。在这个比赛中,您将可以访问来自四大洲20多个中心的最广泛和多样化的卵巢癌组织病理学图像数据集。
评估指标
比赛的提交将使用"平衡准确度"进行评估,对于测试集中的每个image_id
,您需要预测一个label
变量的类别。提交文件应包含一个标题行,并具有以下格式:
image_id,label
2,CC
5,EC
6,HGSC
等等。
数据集介绍
这个竞赛使用了隐藏的测试数据。当您提交笔记本进行评分时,实际的测试数据(包括一个完整的示例提交)将可用于您的笔记本。由于数据集的大小,训练图像不会在您的提交笔记本中可用。
[train/test]_images:包含相关图像的文件夹。有两种类型的图像:全切片图像(WSI)和组织微阵列(TMA)。全切片图像是以20倍放大,可以相当大。TMAs较小(大约4000x4000像素),但以40倍放大。测试集包含来自不同来源医院的图像,其中最大的图像尺寸几乎为100,000 x 50,000像素。
[train/test].csv:训练集的标签。
image_id
- 每个图像的唯一ID代码。label
- 目标类别。是卵巢癌的亚型之一,其中包括CC, EC, HGSC, LGSC, MC, Other
。"Other"类别在训练集中不存在;识别离群值是这个竞赛的挑战之一。仅适用于训练集。image_width
- 图像的宽度(像素)。image_height
- 图像的高度(像素)。is_tma
- 如果幻灯片是组织微阵列,则为True
。仅适用于训练集。
[train/test]_thumbnails:包含全切片图像的较小.png
副本的文件夹。不提供TMAs的缩略图。
sample_submission.csv:一个有效的示例提交文件。只能下载第一行。
赛题赛程
2023 年 12 月 27 日 - 报名截止日期。 2024 年 1 月 3 日 - 最终提交截止日期。
# 竞赛交流群 邀请函 #

每天大模型、算法竞赛、干货资讯





