暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

MIMIC数据库简介

Xiaxia Lab 2022-05-31
6132

点击蓝字  关注我们


MIMIC医疗数据库


MIMIC,是由美国麻省理工所提供的一个大型的公开重症监护医学信息数据库,该数据库记录了2001-2019年间贝斯以色列女狄肯斯医疗中心重症监护病房患者的相关数据,拥有4万多名患者的医疗健康数据和记录。


MIMIC数据库记录了人口统计学信息、实验室检验信息、患者的用药信息、护理人员以及患者的护理级别等、患者的检测成像报告、患者每次出入院信息等海量数据。


版本介绍

MIMIC从开发至今,共存在三个大版本:MIMIC-II,MIMIC-III,MIMIC-IV。


MIMIC-II

2001-2008

MIMIC-II包含2001-2008年的数据。数据是主要从CareVue监视器收集的。MIMIC-II现在已不再公开,但如果想要提取数据,可以从MIMIC-III中获取数据,利用筛选数据库来源为CareVue来提取MIMIC-II的数据。

MIMIC-III

2001-2012

MIMIC-III包含2001-2012年的数据。患者数据是从Metavision和CareVue两个地方采集的。MIMIC-III 数据库当前最新版本是v1.4。这个版本是在2016年9月2日发布,此次发布提高了数据库中的数据质量,为Metavision数据库中的病人提供了大量的补充数据。MIMIC-III v1.4从2016年至今,未再进一步的修正,这也是MIMIC-III 数据库的最终版本。

MIMIC-IV

2008-2019

MIMIC-IV是对MIMIC-III的更新,MIMIC-IV包含2008年至2019年(含)的数据。最近推出的生物标志物将可用。MIMIC-IV来自两个院内数据库系统:一个是定制的医院范围的数字电子健康记录(EHR)、一个是重症监护室(ICU)特定的临床信息系统。以下将以v1.0版本为基础进行介绍。

MIMIC-IV创建流程


01 收购

从各自的医院数据库中提取了入住BIDMC急诊室或其中一个重症监护病房的患者的数据。创建了一个主患者列表,其中包含与2008年至2019年期间入住ICU或急诊室的患者相对应的所有医疗记录编号。所有源表都筛选为仅与主患者列表中的患者相关的行。

02 制备

对数据进行了重新组织,以更好地促进回顾性数据分析。这包括表的非规范化、删除审计跟踪以及重组为较少的表。此过程的目的是简化对数据库的回顾性分析。重要的是,没有执行数据清理步骤,以确保数据反映真实的临床数据集。

03 去识别化

HIPAA 规定的患者标识符已被删除。使用随机密码替换患者标识符,导致患者,住院和ICU住院的整数标识符去识别化。结构化数据是使用查找表格和允许列表过滤的。如有必要,应用了自由文本去识别化算法从自由文本中删除 PHI。最后,日期和时间使用以天为单位的偏移量随机移动到将来。为每个subject_id分配了一个日期班次。因此,单个患者的数据在内部是一致的。例如,如果数据库中两个度量值之间的时间在原始数据中为4 小时,则 MIMIC-IV 中计算的时间差也将为 4 小时。相反,不同的患者在时间上不具有可比性。也就是说,2130年入院的两名患者不一定在同一年入院。

MIMIC-IV内容组成

MIMIC-IV主要分为三大模块,分别是core、hosp、icu。

core

core模块存储使用MIMIC-IV进行任何数据分析所需的患者跟踪信息。内容包含三个表:入院表、患者表和转移表。这些表提供了患者的人口统计数据、每次住院的记录以及住院期间每个病房住宿的记录。



hosp

2

hosp 模块包含从医院范围的EHR 派生的数据。这些测量结果主要记录在住院期间,尽管有些表格也包括来自医院外的数据(例如,在实验室活动中进行的门诊实验室检查)。信息包括实验室测量、微生物培养、提供者订单、药物管理、药物处方、医院账单信息和服务相关信息。



icu

3

icu模块包含来自BIDMC:MetaVision(iMDSoft)的临床信息系统的数据。MetaVision表被非规范化以创建一个星形架构,其中icustays和d_items表链接到一组数据表,所有数据表都以“事件”为后缀。icu模块中记录的数据包括静脉注射和液体输入(输入事件)、患者输出(输出事件)、程序(程序事件)、记录为日期或时间的信息(日期时间事件)以及其他图表信息(图表事件)。所有事件表都包含一个stay_id列,用于识别icustays中的相关ICU患者,以及一个允许识别d_items中记录的概念的 itemid 列。

MIMIC数据库的应用


MIMIC医疗数据库提供了ICU患者各个⽅⾯的信息,免费开放给研究者们使⽤。

⾃发布以来,由于其提供患者信息的丰富性,被⼴泛的应⽤于建⽴预测患者结局的模型、建⽴可应⽤于临床医学病例的实体识别模型、进⾏探究患者各属性之间关系的回顾性研究。包括但不限于基于统计方法的数据分析、基于机器学习的数据分析、基于自然语言处理的数据分析等等。

其中,在患者结局预测⽅⾯应⽤较多,⽽死亡是其最为重要的结局。在疾病⽅⾯,⽬前使⽤MIMIC-III的研究主要针对败⾎症和肾功能疾病为主。

最后,

MIMIC医疗数据库的官方网址为

https://mimic.mit.edu/

希望本文可以帮助大家对

MIMIC数据库

有一个基本的了解和认识



Xiaxia Lab

     科研|教学|数据

联系邮箱|xyu3@qq.com


最后修改时间:2023-06-20 16:35:48
文章转载自Xiaxia Lab,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论