您现在可以在Amazon Athena 中无缝查询 Delta Lake 表,从而提高运营效率、提高查询性能并降低成本。Delta Lake 是一种开源表格式,可帮助实施通常构建在Amazon S3上的现代数据湖架构。在此发布之前,读取 Athena 中的 Delta Lake 表需要一个复杂的过程来生成和管理额外的元数据文件。现在,您可以使用 Athena 直接查询 Delta Lake 表,而无需额外的工作。
Athena 为 Delta Lake 格式的数据湖启用交互式分析和仪表板报告,现在您的 Delta Lake 表更新一旦完成就可以在 Athena 中进行分析。Athena 使用 Delta Lake 文件中包含的元数据来优化您的查询,因此您可以降低数据扫描成本并将 Athena 查询的性能提高多达 40%。Athena 使您可以使用简单的 DDL 语句(例如 CREATE EXTERNAL TABLE 和 DESCRIBE TABLE)更轻松地在 AWS Glue 数据目录中创建和管理 Delta Lake 表,这些语句与 Athena 支持的其他表类型一致。您还可以使用AWS Glue 爬虫在 Delta Lake 文件的 Glue 数据目录中发现 Delta Lake 表模式和管理模式更新,使新编目的数据可用于在 Athena 中无缝分析。
Athena 引擎版本 3 中提供了对 Delta Lake 的增强读取支持,可与 Athena 驱动程序、API 或控制台一起使用,并且在所有受支持的区域都可用。要了解有关 Athena 中新的 Delta Lake 支持的更多信息,请参阅Athena 用户文档中的查询 Delta Lake 表(https://docs.aws.amazon.com/athena/latest/ug/delta-lake-tables.html)。
文章来源:https://aws.amazon.com/cn/about-aws/whats-new/2022/12/athena-enhances-read-support-delta-lake-table-format/




