云计算巨头 AWS 周二推出了一系列新的数据服务,旨在整合 AWS 服务之间的数据移动。
在 AWS re:Invent 2022 用户大会第二天的开幕主题演讲中,AWS 首席执行官 Adam Selipsky概述了一系列旨在帮助组织更好地使用云中数据的新服务。
这些服务包括 Amazon DataZone,它提供数据管理功能,包括数据目录和数据治理。
另一项新的数据管理服务是 Amazon OpenSearch 服务的无服务器版本,现已提供预览版。
预览版中还有一对服务,旨在实现更好的数据集成,而无需跨 AWS 云数据服务进行提取、转换和加载 ( ETL ) 操作。新功能包括 Amazon Aurora 零 ETL 与 Amazon Redshift 的集成以及 Amazon Redshift 与 Apache Spark 的集成。
AWS 与 Microsoft Azure 和 Google Cloud Platform 竞争。AWS 面临的持续挑战是支持驻留在其云平台之外的第三方数据源的能力。
Amalgam Insights的分析师Hyoun Park 表示,AWS 正在努力为所有人提供一切服务。
Park 说,在 re:Invent 2022 上透露的新增内容都与亚马逊需要更加开放、更快地扩展并为用户提供更多背景有关。无服务器功能和增加的数据源支持的结合都响应了将数据转化为业务洞察力的需求。
“这些公告与亚马逊对供应链的关注齐头并进,供应链需要将大量数据转化为实际分析和建议,并显示亚马逊作为大规模数据和分析提供商的持续作用,”Park 说。
AWS 希望简化云数据集成
Selipsky 在他的主题演讲中表示,AWS 的目标是在其服务之间建立集成,以便更轻松地进行分析和机器学习,而无需处理 ETL 任务。
“如果我们可以完全消除 ETL 会怎么样?那将是一个我们都喜欢的世界,”Selipsky 说。“这是我们对零 ETL 未来的愿景。”
他指出,组织花时间构建和管理 ETL 管道的一个领域是事务数据库和数据仓库之间。
为了减少 AWS 云数据服务用例中对 ETL 的需求,这家云巨头构建了新的 Amazon Aurora 与 Amazon Redshift 服务的零 ETL 集成。该服务的目标是让Amazon Aurora 关系数据库的用户轻松地将数据来回移动到Amazon Redshift 数据仓库。
“这种集成将交易数据与分析功能结合在一起,消除了在 Aurora 和 Redshift 之间构建和管理客户数据管道的所有工作,”Selipsky 说。
Apache Spark 的 Amazon Redshift 集成进一步减少了对 ETL 的需求。Apache Spark是一种广泛使用的分析查询引擎。以前,Redshift 用户需要将数据迁移到不同的位置,例如Amazon S3数据湖,才能运行 Spark 查询。

AWS 首席执行官 Adam Selipsky 在 re:invent 2022 上介绍了 DataZone,这是 Amazon Aurora 和 Redshift 的零 ETL 服务。
借助 DataZone,AWS 希望管理云数据
AWS 还通过 Amazon DataZone 的预览瞄准了数据目录和治理市场。DataZone 允许用户在整个组织内编目、发现、共享和管理数据。
DataZone 提供了一个可通过门户网站访问的数据目录,组织内的用户可以在其中找到可用于分析、商业智能和机器学习的数据。DataZone 中的所有数据都由组织可以定义的访问和使用策略管理,并且还会跟踪数据沿袭。
“为了释放数据的全部力量和全部价值,我们需要让应用程序中的合适人员能够轻松找到访问权限并在需要时共享正确的数据,”Selipsky 说。
文章来源:https://www.techtarget.com/searchdatamanagement/news/252527817/AWS-expands-cloud-data-options-with-Amazon-DataZone




