根据 Gartner 的说法,数据库作为孤岛存在的时代已经结束,它报告说,云数据库成为“更广泛的数据生态系统”的一部分的强烈且不断增长的信号。上个月,分析师小组对顶级数据库的生态系统参与度进行了评级,结果可能会让你大吃一惊。
12 月中旬,Gartner 发布了 2023 年云 DBMS 魔力象限 (CDBMS),分析了在公有云和私有云中运行的交易和分析数据库市场。19家云DBMS供应商进入了该象限的最终阶段,该象限由AWS,Microsoft Azure,Google Cloud和Oracle等公司主导。

Gartner 分析师确定的一个主要趋势是标准数据库特性和功能与更广泛的数据管理工具市场提供的特性和功能的混合,这些特性和功能传统上位于 DBMS 之外。
过去,数据库客户通常求助于独立软件供应商 (ISV) 来获得数据沿袭跟踪、数据治理、数据集成/ETL、数据质量和数据安全等数据管理功能。其中许多功能已被整合到所谓的数据结构中,这确保了各种数据管理流程的可重复性和一致性。
但据 Gartner 的分析师称,数据库供应商现在正在与数据管理 ISV 进行更紧密的合作,反之亦然。作为数据堆栈中最重要的一层,数据库与一系列其他重要的数据管理产品很好地配合(或者说更好)是件好事,公司必须依靠这些产品从数据中获取价值,同时最大限度地降低成本和风险。
据 Gartner 称,虽然并非所有 DBMS 提供商都以相同的程度或方式与 ISV 合作,但 DBMS 在数据生态系统中发挥作用的趋势很明显。
“云DBMS系统已经开始意识到周围的其他数据管理组件,并与之协作,”Gartner写道。“这并不意味着云DBMS系统将包含这些其他系统的功能;相反,他们会意识到它们,并通过与它们进行互操作来增加更多价值。
Gartner 表示,围绕 Cloud DBMS 参与更广泛的数据生态系统以及“有意识地与它们进行互操作的目标”,已经“在能力方面有了重大改进”。“如果说有什么不同的话,那就是这方面的进展比预期的要快,自去年的云DBMS魔力象限以来,有许多重要的供应商宣布了这一消息。
在数据生态系统中发挥作用的趋势是一个更广泛的趋势,它并不局限于云DBMS或一般的DBMS(你会记得早在2019年,当时Gartner预测云将篡夺大部分DBMS市场,这是一个正在发生的过程——2022年55%的DBMS支出都在云上, Gartner表示,云计算占整个DBMS市场所有增长的98%。
Gartner 表示,到 2025 年,90% 的新数据和分析部署“将通过已建立的数据生态系统进行,从而实现整个数据和分析市场的整合。更重要的是,该公司表示,到明年年底,55%的IT买家将采用数据生态系统。“这将使供应商格局整合40%,从而降低成本,同时减少选择,”分析师小组表示。
数据生态系统评级
Gartner 对一些云 DBMS 在数据生态系统中的参与给予了更高的评价。虽然它没有在其魔力象限的所有 19 个供应商配置文件中特别提到数据生态系统的参与或互操作性,但它对其中的 10 个供应商配置文件进行了具体提及。以下是它对这 10 个内容的总结:
Gartner 表示,阿里云最近与 MongoDB、ClickHouse 和 PingCAP 等 ISV 建立的合作伙伴关系证明了其云生态系统的改进。“这为第三方D&A(数据和分析)解决方案提供了更多选择,同时减少了阿里云的集成工作,”Gartner在其魔力象限中表示,阿里云在领导者象限中。
Gartner 还讨论了 AWS 向数据生态系统迈进的动向。它指出,这家云巨头拥有资源“在Amazon DataZone开始的工作基础上,转向一套更集成的解决方案”,这是去年10月正式发布的数据管理服务,由数据门户、数据目录、数据项目和环境以及治理和访问控制层组成。然而,Gartner也警告说,不要使用全AWS生态系统,这引发了锁定问题。
Cloudera被Gartner列入其“远见者”象限,其数据生态系统工作获得了很高的评价。Gartner 表示:“Cloudera 继续投资于其开源领导力,通过其数据生态系统中的开放标准推动社区创新,在所有云数据架构中提供便携式数据和 AI 服务。“凭借跨所有云和本地的集中控制平面,它提供了集成的安全性、元数据和治理,以及应用的可观测性和开放数据生态系统。”
Gartner指出,与Cloudera相比,通过云提供商提供的生态系统更加“紧密集成”,并且“更易于使用”。然而,Cloudera致力于多云和混合部署,以及工作负载的易移植性,“是对这种竞争压力的有效平衡,这种竞争压力需要持续努力才能保持有效,”Gartner说。
Couchbase 开发了一个主要用于事务和运营用例的 NoSQL 数据库,因其在移动和边缘方面的能力以及其托管数据库服务 Capella 的易用性而受到 Gartner 的称赞。然而,根据 Gartner 的数据,Couchbase 缺乏生态系统支持,将 Couchbase 置于利基玩家象限。
“Couchbase没有全面的能力来访问数据,也没有向Couchbase世界之外的引擎提供数据,尽管它们已经在其路线图上,”该分析师小组说。“与生态系统中的多个引擎进行广泛交互的能力正在推动多个用例的灵活性和效率的提高,其中最突出的是分析和人工智能。其他非关系型产品也有这个局限性。
Gartner 将 Databricks 列入领导者象限,在 Unity Catalog 方面获得了高分,Unity Catalog 是该公司的元数据目录和治理中心,用于 Databricks 以及外部存储库中存在的数据。Gartner 还称赞了 Delta Live Tables 的数据生态系统,因为它能够简化流式处理、批处理和 AI 工作负载的 ETL 管道开发。
Gartner 对 Google Cloud 的数据生态系统参与也有好话要说,谷歌云也在领导者象限中推出。Gartner 特别赞扬了 Dataplex,其元数据/治理层实现了更加集成的数据生态系统。
Microsoft 在 Gartner 的领导者象限中也获得了高分,因为它愿意使其数据库更加开放,并与其他 Microsoft 产品(包括 Microsoft 365、Power BI 和 Purview)以及 ISV 的外部解决方案合作。
“这为客户提供了更一致的体验,”Gartner 说。“与此同时,Microsoft Fabric的'一个湖'方向为非Microsoft系统中的数据带来了更多的开放性,这有可能减少其客户的供应商锁定问题。然而,一些Microsoft客户对Microsoft DBMS生态系统功能的复杂性表示担忧,这损害了性能,安全性和成本控制。
SAP 是 Gartner 魔力象限中的远见者,因其在同一 HANA 数据库中运行运营和分析工作负载的能力而受到称赞。Gartner 还喜欢 SAP Datasphere 在生态系统中统一 SAP 和非 SAP 数据的能力。
Gartner 表示:“SAP 现在能够通过文件交换、复制和联合在 SAP 和非 SAP 环境之间导入和导出数据,这更加开放。然而,该分析师表示,很少有非SAP客户会使用SAP来管理数据。Datasphere很可能被拥有“大量SAP技术存在”的客户使用。
Snowflake开发了一个分析数据仓库,并进入了领导者象限,其“强大”的生态系统能力也得到了Gartner的认可。Gartner 表示:“Snowflake 提倡易于使用的集成解决方案的理念,并辅以强大的数据共享和数据市场故事。
Teradata是另一家在数据生态系统中扮演角色的数据仓库提供商。Gartner 将 Teradata 列入远见象限,它喜欢 Teradata 的 QueryGrid 功能,该功能“通过在适当的情况下智能地降低处理速度、从 Teradata 机器卸载周期并减少必须返回给 Teradata 的数据量,有效地实现对 Teradata 外部数据的访问,”Gartner 说。
云DBMS显然具有与第三方数据管理工具和更广泛的数据生态系统集成之外的功能。但正如 Gartner 所表明的那样,数据库的生态系统等级正成为数据库购买者更重要的考虑因素。




