云领导者 AWS 对 IT 趋势的影响有多种形式,但没有一种比其稳定的数据库服务更具影响力。
在大多数年度 re:Invent 会议上,AWS 推出了一个闪亮的新数据库,证实了该公司在基于云的数据库中的存在。这些有时是开源的,通常是专门构建的。
但今年不同了。在AWS re:Invent 2022大会上,该公司将目光转向使其现有的一系列云数据工具更适合企业 IT。这意味着现在需要关注数据集成和数据管理。
为此,该公司发布了 Amazon DataZone 数据管理服务,以对存储在 AWS 云和本地的数据进行分类和管理。AWS 表示,DataZone 还可以通过 API 支持第三方资源,并在这方面提到了合作伙伴 DataBricks、Snowflake 和 Tableau。
Combining data feeds
AWS 首席执行官 Adam Selipsky 告诉 re:Invent 与会者,现在和以前一样,成本效益将 IT 推向云端。对于今天的 AWS,具有成本效益的数据引擎从 Aurora(AWS 的开源 PostgreSQL 版本)和 Redshift 开始,Redshift 是柱状 MPP 数据仓库,它在 2012 年推出时颠覆了数据分析的经济性。
带来 Aurora 和 Redshift 的数据库队伍还包括 RDS、Neptune、DynamoDB、DocumentDB、Elastic Cache、TimeStream和Quantum Ledger DB,其中一些激起争议,因为初创企业正在与云巨头 AWS 积极的开源许可方式作斗争.
Selipsky 来参加 re:Invent 并不是为了兜售新数据库——尽管对几个现有引擎进行了更新。相反,他提倡更有效地将现有投资组合捆绑在一起的概念。
“拥有所有这些工具来存储和分析数据揭示了人们面临的下一个挑战......你需要能够将这些不同数据探索方法的信息结合起来才能看到全貌并真正获得洞察力,”他说。
Give ‘em ETL
在他的 re:Invent 演讲中,Selipsky 瞄准了围绕 Extract Transform Load (ETL) 的集成挑战,ETL 是创新者最近重新审视的长期酝酿的高科技死水。
他宣布了新的集成,据说可以消除 Amazon Aurora 和 Amazon Redshift 服务之间以及 Spark 和 Redshift 之间对 ETL 的需求。
Selipsky 的目标很明确。随着低代码/无代码的兴起,可能是时候启动“零 ETL”了。这是数据处理的一个阶段,涉及大量重复的自定义脚本,当数字化转型是企业的最终目标时,这是必要的并且通常被掩盖了。
ETL 数据准备的枯燥工作会阻碍进步。为了表明 IT 对该过程的失望,Selipsky 阅读了一封来自客户的信件的摘录,该信件将 ETL 描述为“吃力不讨好的、不可持续的黑洞”。他说,新的 Aurora 和 Redshift 功能可帮助客户在 AWS 上迈向零 ETL 的未来。
Echoes of Tableau
尽管可能被机器学习和其他公告所掩盖,但 re:Invent 2022 对更大数据管理问题的关注表明 AWS 满足 IT 数据需求的方法已经成熟。
此处还暗示 Adam Selipsky 正在为 AWS 云设置新课程。考虑到他多年掌管商业智能提供商 Tableau,这并非完全出乎意料。
在他的领导下,Tableau 因在可视化数据呈现方面的创新而脱颖而出,并确立了自己在结构化和非结构化数据集的易用性和拖放式集成支持方面的专家地位。
AWS 的 DataZone 和 Zero-ETL 恰好符合云数据演变的类似图景。未来的举措将受到密切关注,看看 AWS 是否正在向数据大厦的上层移动。
文章来源:https://venturebeat.com/data-infrastructure/cloud-leader-aws-shifts-its-database-focus-to-datazone-and-zero-etl/




