2023年8月2日消息,Oracle 已发布 MySQL HeatWave Lakehouse,使客户能够像查询数据库内的数据一样快速地查询对象存储中的数据。
MySQL HeatWave Lakehouse 支持多种对象存储文件格式(例如 CSV、Parquet)以及从其他数据库导出文件,并且可以在同一查询中将对象存储文件数据和 MySQL 数据库事务数据组合在一起。
HeatWave 直接查询对象存储文件,无需将数据复制到 MySQL 数据库中。因此,MySQL HeatWave Lakehouse 为查询处理的可扩展性和性能、加载数据的速度、集群配置时间以及对象存储中数据查询的自动化设定了新的标准。
“超过 80% 的数据存储在文件系统中,而且这个数字还在不断增长。客户希望将这些不同的外部数据与其内部事务数据集成并分析,但处理起来往往太复杂或太昂贵,”Oracle 首席企业架构师 Edward Screven 说道。“MySQL HeatWave Lakehouse 通过将对象存储中的数据与数据库数据相结合,使客户能够轻松获得有价值的实时见解,同时以更低的成本获得显着更高的查询性能和更快的数据加载。”
据该公司介绍,根据 500 TB TPC-H 基准测试,MySQL HeatWave Lakehouse 的查询性能为:
- 比 Amazon Redshift 快 9 倍
- 比 Snowflake 快 17 倍
- 比 Databricks 快 17 倍
- 比 Google BigQuery 快 36 倍
使用 MySQL HeatWave Lakehouse 从对象存储加载数据的性能为:
- 比 Amazon Redshift 快 9 倍
- 比 Snowflake 快 2 倍
- 比 Databricks 快 6 倍
- 比 Google BigQuery 快 8 倍
MySQL HeatWave 的性能得益于其横向扩展架构,该架构支持大规模并行性来配置集群、加载数据并处理多达 512 个节点的查询。
此外,MySQL Autopilot 的增强功能可自动创建对象文件的元数据,并动态适应底层对象存储的性能,以在任何 OCI 区域中提供最佳性能。
据 Oracle 称,MySQL HeatWave 是唯一在单个 MySQL 数据库服务中提供事务处理、实时分析、机器学习、数据湖查询和基于机器学习的自动化的云服务。作为 Oracle 分布式云战略的核心部分,MySQL HeatWave 可在 OCI 中使用、本地在 Amazon Web Services 上使用、作为 Azure 的 Oracle 数据库服务的一部分以及在 OCI 专用区域的客户数据中心中使用。
文章来源:https://www.dbta.com/Editorial/News-Flashes/Oracle-Introduces-MySQL-HeatWave-Lakehouse-for-Querying-Data-159888.aspx




