暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

Kaggle赛题解析:UBC 卵巢癌分类

Coggle数据科学 2023-10-12
521
  • 赛题名称:UBC Ovarian Cancer Subtype Classification and Outlier Detection (UBC-OCEAN)
  • 赛题任务:UBC 卵巢癌亚型分类和异常值检测
  • 赛题类型:计算机视觉、图像分类
  • 赛题链接👇:

https://www.kaggle.com/competitions/UBC-OCEAN/overview

比赛介绍

卵巢癌是女性生殖系统中最致命的癌症之一。它有五个常见的亚型:高级别浆液性癌、透明细胞卵巢癌、子宫内膜样癌、低级别浆液性癌和黏液性癌。此外,还有一些罕见的亚型("离群值")。所有这些亚型都具有明显的细胞形态、病因、分子和遗传特征以及临床属性。亚型特定的治疗方法逐渐崭露头角,但首先需要进行亚型鉴定,这个过程可以通过数据科学进行改进。

目前,卵巢癌的诊断依赖于病理学家来评估亚型。然而,这带来了一些挑战,包括观察者之间的分歧和诊断的可重复性。此外,一些未得到充分服务的社区通常缺乏专业病理学家,即使在发达社区中,也面临着专门研究妇科恶性肿瘤的病理学家短缺的问题。

深度学习模型在分析组织病理学图像方面表现出卓越的能力。然而,仍然存在挑战,比如需要大量的培训数据,最好来自单一来源。技术、伦理、财务约束以及保密方面的顾虑使培训变得具有挑战性。在这个比赛中,您将可以访问来自四大洲20多个中心的最广泛和多样化的卵巢癌组织病理学图像数据集。

评估指标

比赛的提交将使用"平衡准确度"进行评估,对于测试集中的每个image_id
,您需要预测一个label
变量的类别。提交文件应包含一个标题行,并具有以下格式:

image_id,label
2,CC
5,EC
6,HGSC
等等。

数据集介绍

这个竞赛使用了隐藏的测试数据。当您提交笔记本进行评分时,实际的测试数据(包括一个完整的示例提交)将可用于您的笔记本。由于数据集的大小,训练图像不会在您的提交笔记本中可用。

[train/test]_images:包含相关图像的文件夹。有两种类型的图像:全切片图像(WSI)和组织微阵列(TMA)。全切片图像是以20倍放大,可以相当大。TMAs较小(大约4000x4000像素),但以40倍放大。测试集包含来自不同来源医院的图像,其中最大的图像尺寸几乎为100,000 x 50,000像素。

[train/test].csv:训练集的标签。

  • image_id
    - 每个图像的唯一ID代码。
  • label
    - 目标类别。是卵巢癌的亚型之一,其中包括CC, EC, HGSC, LGSC, MC, Other
    。"Other"类别在训练集中不存在;识别离群值是这个竞赛的挑战之一。仅适用于训练集。
  • image_width
    - 图像的宽度(像素)。
  • image_height
    - 图像的高度(像素)。
  • is_tma
    - 如果幻灯片是组织微阵列,则为True
    。仅适用于训练集。

[train/test]_thumbnails:包含全切片图像的较小.png
副本的文件夹。不提供TMAs的缩略图。

sample_submission.csv:一个有效的示例提交文件。只能下载第一行。

赛题赛程

  • 2023 年 12 月 27 日 - 报名截止日期。
  • 2024 年 1 月 3 日 - 最终提交截止日期。

 竞赛交流群 邀请函  #

△长按添加竞赛小助手

每天大模型、算法竞赛、干货资讯

与 37000+来自竞赛爱好者一起交流~

文章转载自Coggle数据科学,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论