

数·据颠覆者 Data Disruptors
出于众所周知的原因,美国公共医疗体系过去数十年来一直处于积极转型阶段。无论医保,还是医疗补助服务中心都在努力塑造一种激励价值,而非单纯着重数量的形象。这种向以价值为中心的变革,对该国各地的医疗保障机构都产生了深刻影响。
这些机构每年为千万量级的注册会员提供服务,平均预算在数千亿美元。鉴于各州逐渐从传统基于所提供服务量的收费式服务、向先进的基于服务质量及价值的服务模式稳步前进,这一广泛的结构性转变对组织处理信息的方式产生了巨大变革,并极大抬升了数据分析需处理的数量和种类要求。
全新重点,同样需要最新、最先进的数据驱动型战略,以确保公共健康和社会护理服务人员有能力来主动检测、解决甚至预防疾病,面向服务对象的一系列行为、社会、经济和住房基础条件,有效避免更大的痛苦或医疗资源缺乏状况。而湖仓一体的统一分析平台 Vertica,正为这种复杂的分析要求带来了所期望的速度和规模,这对于改革医疗体系以及融资超数十亿美元的医疗补助计划至关重要。
素材 _ Vertica Global
编辑 _ Lu, Vertica 中国团队
渐进式医疗改革
以数据为证,向价值中心论转型
美国公认的医疗保健及服务系统领导者 Jason Helgerson 评论称:
“在这个越来越透明、越来越需要对财务报表负责的新时代,我们急需先进的数据和分析能力的支持,以实现海量可信数据安全地移动、共享和分析。而 CMA 是领先的医疗补助信息技术合作伙伴,在新的运营体系中发挥关键作用。”
以 CMA 服务的某个客户为例,该州数据和分析规模在近 10 年内增加了至少 2 倍。主要事实表在最初的数据规模约为 50 亿行,现已扩展至超过 150 亿行;与此同时,医疗补助用户数也增加了 2 倍之多,对分析洞察的需求也同步增长。
偏偏此时,该客户传统基于 Oracle 行的数据库架构开始“难产”——难以扩展至所需的分析水平,甚至可能无法满足与性能挂钩的基本服务水平承诺。
CMA 最初的是考虑扩大或增强数据仓库平台,但很快就得出结论——成本太高。它需要另辟蹊径,开发一种新思路,既能满足对容量和查询性能不断增长的需求,而又不至于背负过重的技术债务。
携手一流合作伙伴 Vertica
超越行式数据架构之极限
自此,CMA 评估了市面上非常多的数据库技术及解决方案,并开展了范围相当广泛的概念验证(PoC),最终它的选择是湖仓一体的统一分析平台 Vertica。Helgerson 表示:
“Vertica 和 CMA 的‘天作之合’满足了基于事实的决策标准,这对该州成功兑现转型承诺是不可或缺的。”
CMA 首席技术官 Brian Dougherty 对此也赞不绝口:
“与其他分析数据库平台相比,Vertica 具有相当的优势。首先,它的功能图谱非常完善,并能以相当流畅的方式进行扩展。而对客户而言最重要的是,Vertica 提供了令人信服的‘性能-价格’比,也就是所谓的‘性价比’,以及从传统的行式存储向列式压缩架构过渡。”
Vertica 的列式高性能压缩架构,可以在选定列上独立执行查询,大大减少必需扫描空间。这对 Medicaid 机构而言有着独特的价值,因为它要处理相当庞大的数据库表(最大包含 600 列数据)。此外,Vertica 还提供了先进的优化器技术,能非常有效地利用内部列集,帮助用户迅速确定所需的精确数据,并对这些数据执行隔离分析:
“坦白而言,市场上有很多列压缩存储选项,但都没有 Vertica 这么成熟,”Dougherty 说,“这是我们选择它的关键原因,因为其优化器非常适用于在较小表的列集中进行工作任务或资源隔离。”
经过仔细评估,CMA 决议采用一系列 Vertica 数据集市来扩展其基于行的核心数据分析环境,并开展多项优化工程,以满足高负载的吞吐量、超快的分析查询效率和多用户查询的高并发性。
这同时意味着,该组织需要一种有效的方法,将大量数据从基于行的主要数据仓库转换并迁移至 Vertica 环境中。继续使用现有数据库已经穷途陌路了,因为它们无法有效适应这种激烈环境。

CMA 随即找到了解决方案——Mosaic DART,一个高性能的数据移动平台。使用这一专利,CMA 得以将成千上万的数据库对象,从其本地基于行的结构转化为经由 Vertica 优化的数据结构。这一切过程都是自动完成的,一步到位,直接消除了预估要几个月时间的工作量。此外,Mosaic DART 实现了 Vertica 与该州既有数据仓库工作流程的无缝整合,进一步降低了数据迁移的成本、复杂性和风险。基于 Mosaic DART 的强力支持,CMA 每周都会将数十 TB 数据又快又轻松地转移至 Vertica 集群。
CMA 总裁 Ken Romanski 解释道:
“Mosaic DART 协调了从主要数据仓库提取数据、转换结构并将其纳入 Vertica 的端到端进程。现在一切再简单不过,我们只需打开屏幕,点击一下,Mosaic DART 就会自动处理剩下步骤,这使得 DBA 的精力得以专注于其他优先事项。”
事实证明,Vertica 和 Mosaic DART 对 CMA 而言是一个生机勃勃的组合,促进了服务目标(SLA)在其关键却高度复杂的分析查询项目中的实现。
现在,该州医疗补助计划的日常分析工作效率提速近 75%;扫描主要事实表之前平均需要 25 分钟,现在用 Vertica 不到 1 分钟就全部完成。CMA 还借助 Vertica 的力量,多次扩大环境规模,以分析更多数据并支持更多并发用户,而其中没出现半点差池。
划时代的分析引擎
补全医疗体系短板、迎接最佳结果
由于 Vertica 具备强大的压缩和高效的优化能力,该平台对硬件及存储的要求较低;同时与同类解决方案相比,它的许可证成本更低。
这使得 CMA 可以通过一种颇具成本效益的方式实现其现代化转型目标。据估计,Vertica 需要的物理硬件比其传统基于行的数据库少 3 倍左右,但却能支持相同的数据量。Brian Dougherty 提供了一个对比:
“我们目前运营着一个总共 8 节点的集群,来支持最大的行式数据库,其中共存储有约 100TB 的数据,并由一个全闪存阵列提供支持;同样的数据在 Vertica 中储存于 16 个 1U 的服务器上。如果比较这两个硬件平台的零售价,我们吃惊地发现,Vertica 的总拥有成本(TCO)要低 10 倍。”

Vertica 的列式压缩存储设计,极大提升了执行复杂查询的速度和效率。这为渐进式的迭代分析提供了一个宽容更高的环境,支持用户快速完善并重新运行查询,所以在更短的时间内,他们只需更少精力就能获得所需的答案。它同时也是支持多用户并行处理的最佳选择,用户可以同时享受持续的高性能成果。Dougherty 阐述道:
“比如说,我们想总结全部诊断证明和相关索赔金额,并按供应商分组。这一查询需要扫描约 140 亿条记录。之前性能最高的行式数据库需要几分钟的时间才能完成;而在 Vertica 中,20-30 秒就能获得结果,效率提升超过 80%。”
基于其运行高度复杂的迭代查询的能力,Vertica 解决方案正帮助美国各州深入挖掘日益增长的医疗补助数据,并使各州更充分地拓展其以价值为中心的服务模式,更有助于通过让供应商承担起对护理质量、结果和成本的责任,以从根上改变该国医疗保健的运营模式。Romanski 总结称:
“Vertica 深入分析海量数据的能力,有助于我们持续适应客户最新需求。帮助管理他们复杂的改革举措,优化公共资源利用率,并改善我们医疗体系之中堪称最脆弱的点——公民医保的最终结果。”
分享 就是爱 ⎪ 我知道你 在看 哦





