
“超过 80% 的数据存储在文件系统中,而且这个数字还在不断增长。客户希望将这些不同的外部数据与其内部事务数据集成并分析,但处理起来往往太复杂或太昂贵,”Oracle 首席企业架构师 Edward Screven 说道。“MySQL HeatWave Lakehouse 通过将对象存储中的数据与数据库数据相结合,使客户能够轻松获得有价值的实时见解,同时以更低的成本获得显着更高的查询性能和更快的数据加载。”
查询对象存储中的数据与查询数据库内的数据一样快
正如10 TB TPC-H* 基准测试所证明的那样,使用 MySQL HeatWave Lakehouse 查询流行文件格式的对象存储中的数据与查询 MySQL 数据库中的数据一样快。这是通过MySQL Autopilot实现的,它是 MySQL HeatWave 的内置功能,提供机器学习驱动的自动化,可以从查询的执行中学习并改进未来查询的执行计划。MySQL Autopilot 是 MySQL HeatWave 中的一项创新,是其他任何地方都无法提供的。Oracle 云基础设施 (OCI) 上的 MySQL HeatWave 由 AMD EPYC™ 处理器提供支持。
AMD 执行副总裁兼数据中心解决方案业务部总经理 Forrest Norrod 表示:“AMD 和 MySQL HeatWave 工程团队正在密切合作,为 AMD EPYC 处理器优化 MySQL HeatWave,以利用新的处理器功能。” “得益于此次合作,在 AMD EPYC CPU 驱动的 OCI 实例上运行 MySQL HeatWave 的 MySQL 客户可以从其业务关键型工作负载中获得出色的性价比优势,包括对对象存储中存储的大量数据进行实时分析。”
Lakehouse 用例的最佳性能
根据500 TB TPC-H* 基准测试,MySQL HeatWave Lakehouse 的查询性能为:
- 比 Amazon Redshift 快 9 倍
- 比 Snowflake 快 17 倍
- 比 Databricks 快 17 倍
- 比 Google BigQuery 快 36 倍
使用 MySQL HeatWave Lakehouse 从对象存储加载数据的性能为:
- 比 Amazon Redshift 快 9 倍
- 比 Snowflake 快 2 倍
- 比 Databricks 快 6 倍
- 比 Google BigQuery 快 8 倍
MySQL HeatWave 无与伦比的性能得益于其横向扩展架构,该架构支持大规模并行性,以配置集群、加载数据并处理多达 512 个节点的查询。此外,MySQL Autopilot 的增强功能可自动创建对象文件的元数据,并动态适应底层对象存储的性能,以在任何 OCI 区域中提供最佳性能。
MySQL HeatWave 是唯一在单个 MySQL 数据库服务中提供事务处理、实时分析、机器学习、数据湖查询和基于机器学习的自动化的云服务。作为 Oracle 分布式云战略的核心部分,MySQL HeatWave 可在 OCI 中使用、本地在 Amazon Web Services 上使用、作为 Azure 的 Oracle 数据库服务的一部分以及在 OCI 专用区域的客户数据中心中使用。
了解客户、合作伙伴和分析师对 MySQL HeatWave Lakehouse 的评价
“数据呈指数级增长,我们存储在数据湖中的数据量也在呈指数级增长。使用标准 MySQL 语法跨数据库和对象存储查询数据以获得实时见解的能力对于 Natura 来说非常重要。”Natura&Co 解决方案架构师 Fabricio Rucci 说道。“如果我们能够比竞争对手更快地分析所有这些数据,这将开辟新的探索机会,并可能代表新的竞争优势。”
德勤咨询公司云基础设施和工程负责人 Henry Tullis 表示:“HeatWave Lakehouse 能够很好地进行扩展,可以从对象存储加载数据以及在对象存储上运行查询。” “随着数据大小的增长以及 HeatWave 集群大小的相应增长,加载时间和查询时间几乎保持不变。HeatWave Lakehouse 用于数据管理的这种横向扩展特性是高效处理大量数据的关键。”
Constellation Research 副总裁兼首席分析师 Holger Mueller 表示:“自从大数据出现以来,大数据/Lakehouse 查询比事务查询要慢得多,这是一个既定事实。” “MySQL HeatWave 永远结束了这一点,证明 Lakehouse 的性能可以与事务查询性能相同——这是闻所未闻的,甚至是不可想象的。通过查询性能奇偶校验,HeatWave 使 CxO 无需再担心将数据放在哪里以及如何查询数据。“秘密武器”是 HeatWave 的 Autopilot,它可以优化查询。HeatWave 团队再一次创造了行业第一。”
文章来源:https://www.oracle.com/news/announcement/oracle-announces-general-availability-mysql-heatwave-lakehouse-2023-07-20/




