暂无图片
暂无图片
14
暂无图片
暂无图片
暂无图片

AWS 宣布五项新的数据库和分析功能

原创 通讯员 2022-12-06
1508

在 AWS re:Invent 上,Amazon Web Services, Inc. (AWS) 是 Amazon.com, Inc. 旗下公司(纳斯达克代码:AMZN),11月30日宣布了其数据库和分析产品组合中的五项新功能,这些功能使客户能够更快、更轻松地管理和分析 PB 级的数据。Amazon DocumentDB(与 MongoDB 兼容)、Amazon OpenSearch Service 和 Amazon Athena 的这些新功能使客户能够更轻松地大规模运行高性能数据库和分析工作负载。此外,AWS 还宣布了 AWS Glue 的一项新功能,可以跨数据湖和数据管道自动管理数据质量。最后,Amazon Redshift 现在支持跨多个 AWS 可用区 (AZ) 的高可用性配置。今天的公告使客户能够访问适合其数据工作负载的正确工具、大规模运营并提高可用性,从而帮助客户充分利用其在 AWS 上的数据。

    • Amazon DocumentDB Elastic Clusters 可扩展客户的文档工作负载以支持每秒数百万次写入并存储 PB 级数据
    • Amazon OpenSearch Serverless可帮助客户运行搜索和分析工作负载,而无需配置、扩展或管理底层基础设施
    • Amazon Athena for Apache Spark 使客户能够在不到一秒而不是几分钟的时间内开始使用 Apache Spark 进行交互式分析
    • AWS Glue 数据质量通过自动测量、监控和管理数据湖和数据管道中的数据质量,将数据分析和规则识别的时间从几天缩短到几小时
    • Amazon Redshift 现在支持跨多个 AWS 可用区的高可用性配置


副总裁 Swami Sivasubramanian 表示:“数据本质上是动态的,要充分发挥其潜力,需要一种端到端的数据策略,该策略可以根据客户的需求进行扩展,并适应所有类型的用例——无论是现在还是将来。” AWS 数据库、分析和机器学习总裁。“为了帮助客户充分利用他们不断增长的数据量和多样性,我们致力于提供最广泛和最深入的数据库和分析服务。今天宣布的新功能以此为基础,让客户更容易查询、管理和扩展他们的数据,从而更快地做出数据驱动的决策。”

今天的组织从越来越多的来源(例如,数字媒体、在线交易和连接的设备)创建和存储 PB 级甚至 EB 级的数据。为了最大限度地发挥这些数据的价值,客户需要一种端到端的数据策略,为所有数据工作负载和应用程序提供对正确工具的访问,以及随着数据量和速度的增加而大规模可靠地执行的能力。为了支持客户设计自己的端到端数据策略,AWS 提供了业界最全面的数据服务和解决方案。这包括针对客户最重要的用例优化的完全托管数据库,例如用于关系数据库的 Amazon Aurora 和用于文档数据库的 Amazon DocumentDB。它还包括范围广泛的分析服务,以帮助客户从他们的数据中获得有价值的见解,包括用于搜索和分析工作负载(例如,实时应用程序监控、日志分析和网站搜索)的 Amazon OpenSearch Service、用于交互式分析的 Amazon Athena 、用于数据集成的 AWS Glue 和用于数据仓库的 Amazon Redshift。今天的公告以这些具有高级功能的服务为基础。


  • Amazon DocumentDB 弹性集群以每秒数百万次写入为 PB 级应用程序提供支持:数以万计的客户使用 Amazon DocumentDB 来运行他们的文档工作负载,因为它速度快、可扩展、高度可用且完全托管。虽然每个 Amazon DocumentDB 节点最多可扩展到 64 TB 的数据并支持每秒数百万次读取请求,但工作负载要求极高的一部分客户需要能够扩展到超出这些限制的能力,以支持每秒数百万次写入并存储 PB 级数据. 以前,这些客户必须跨多个 Amazon DocumentDB 节点手动分发数据和管理容量。Amazon DocumentDB Elastic Clusters 允许客户在几分钟内扩展到超出单个数据库节点的限制,支持每秒数百万次的读写并存储高达 2 PB 的数据。随着工作量需求的增加,Amazon DocumentDB Elastic Clusters 利用分布式存储系统自动将大型数据集划分到多个节点。这消除了客户编写自定义代码来分发数据集和跨节点手动管理容量的需要。底层基础设施是自动管理的,因此客户可以根据自己的需要轻松扩展容量,而无需配置、扩展或管理数据库集群。要了解有关 Amazon DocumentDB 弹性集群的更多信息,请访问 因此,客户可以根据自己的需要轻松扩展容量,而无需配置、扩展或管理数据库集群。要了解有关 Amazon DocumentDB 弹性集群的更多信息,请访问 因此,客户可以根据自己的需要轻松扩展容量,而无需配置、扩展或管理数据库集群。
  • Amazon OpenSearch Serverless 自动扩展搜索和分析工作负载:为了支持网站搜索和实时应用程序监控等用例,数以万计的客户使用 Amazon OpenSearch Service。其中许多工作负载容易出现突然的、间歇性的使用高峰,使容量规划变得困难。Amazon OpenSearch Serverless 自动预置、配置和扩展 OpenSearch 基础设施,以提供快速数据摄取和毫秒查询响应,即使对于不可预测和间歇性的工作负载也是如此。借助 Amazon OpenSearch Serverless,数据摄取和搜索资源可以独立扩展,从而允许这些操作并发运行而不会影响性能。使用 Amazon OpenSearch Serverless 的客户可以获得无服务器优势(例如,自动配置、按需扩展和按使用付费定价),以及 Amazon OpenSearch Service 功能,例如内置数据可视化,可帮助他们了解日志数据、识别异常情况并查看搜索相关性排名。
  • 用于 Apache Spark 的 Amazon Athena 将交互式分析的启动加速到不到一秒:客户使用无服务器交互式查询服务 Amazon Athena,因为它是使用标准 SQL 接口在 Amazon Simple Storage Service (Amazon S3) 中查询 PB 级数据的最简单、最快速的方法之一。在使用 Apache Spark 时,许多客户都在寻求同样的易用性,Apache Spark 是一种用于支持流行语言框架(即 Java、Scala、Python 和 R)的大数据工作负载的开源处理框架。虽然开发人员享受 Apache Spark 的快速查询速度和易用性,但他们不想在每次运行查询时都花时间设置、管理和扩展他们自己的 Apache Spark 基础设施。现在,借助 Amazon Athena for Apache Spark,客户无需自己预置、配置和扩展资源。交互式 Apache Spark 应用程序启动时间不到一秒,执行速度比使用 AWS 优化的 Spark 运行时的开源应用程序更快。由于 Amazon Athena 与其他 AWS 服务集成,客户可以从多个来源查询数据,将计算链接在一起进行复杂分析,并将结果可视化。适用于 Apache Spark 的 Amazon Athena 会根据应用程序需求自动确定所需的资源并根据需要进行扩展,因此客户只需为他们运行的查询付费。要开始使用 Amazon Athena for Apache Spark,请访问 适用于 Apache Spark 的 Amazon Athena 会根据应用程序需求自动确定所需的资源并根据需要进行扩展,因此客户只需为他们运行的查询付费。要开始使用 Amazon Athena for Apache Spark,请访问 适用于 Apache Spark 的 Amazon Athena 会根据应用程序需求自动确定所需的资源并根据需要进行扩展,因此客户只需为他们运行的查询付费。
  • AWS Glue 数据质量自动监控和管理数据的新鲜度、准确性和完整性:成千上万的客户使用 AWS Glue 快速、轻松且经济高效地构建和管理现代数据管道。组织需要监控其数据湖和数据管道中信息的数据质量(衡量数据的新鲜度、准确性和完整性),以确保其高质量,然后再将其用于分析或机器学习应用程序。但有效的数据质量管理是一个耗时且复杂的过程,需要数据工程师花费数天时间收集数据的详细统计数据,根据这些统计数据手动识别数据质量规则,并将其应用于数千个数据集和数据管道。一旦实施了这些规则,数据工程师必须持续监控数据中的错误或变化,以相应地调整规则。AWS Glue 数据质量自动测量、监控和管理 Amazon S3 数据湖和 AWS Glue 数据管道的数据质量,将数据分析和规则识别的时间从几天缩短到几小时。AWS Glue 数据质量计算客户数据集的统计数据(例如,最小值、最大值、直方图和相关性)并使用它们自动推荐规则以确保数据的新鲜度、准确性和完整性。客户可以安排 AWS Glue Data Quality 在数据发生变化时定期运行,自动分析数据并对质量规则提出更改建议以确保相关性。数据工程师可以配置操作以在出现质量问题时提醒用户或停止数据管道,而无需编写代码。要了解有关 AWS Glue 数据质量的更多信息,请访问 管理 Amazon S3 数据湖和 AWS Glue 数据管道的数据质量,将数据分析和规则识别的时间从几天缩短到几小时。AWS Glue 数据质量计算客户数据集的统计数据(例如,最小值、最大值、直方图和相关性)并使用它们自动推荐规则以确保数据的新鲜度、准确性和完整性。客户可以安排 AWS Glue Data Quality 在数据发生变化时定期运行,自动分析数据并对质量规则提出更改建议以确保相关性。数据工程师可以配置操作以在出现质量问题时提醒用户或停止数据管道,而无需编写代码。要了解有关 AWS Glue 数据质量的更多信息,请访问 管理 Amazon S3 数据湖和 AWS Glue 数据管道的数据质量,将数据分析和规则识别的时间从几天缩短到几小时。AWS Glue 数据质量计算客户数据集的统计数据(例如,最小值、最大值、直方图和相关性)并使用它们自动推荐规则以确保数据的新鲜度、准确性和完整性。客户可以安排 AWS Glue Data Quality 在数据发生变化时定期运行,自动分析数据并对质量规则提出更改建议以确保相关性。数据工程师可以配置操作以在出现质量问题时提醒用户或停止数据管道,而无需编写代码。要了解有关 AWS Glue 数据质量的更多信息,请访问 将数据分析和规则识别的时间从几天缩短到几小时。AWS Glue 数据质量计算客户数据集的统计数据(例如,最小值、最大值、直方图和相关性)并使用它们自动推荐规则以确保数据的新鲜度、准确性和完整性。客户可以安排 AWS Glue Data Quality 在数据发生变化时定期运行,自动分析数据并对质量规则提出更改建议以确保相关性。数据工程师可以配置操作以在出现质量问题时提醒用户或停止数据管道,而无需编写代码。要了解有关 AWS Glue 数据质量的更多信息,请访问 将数据分析和规则识别的时间从几天缩短到几小时。AWS Glue 数据质量计算客户数据集的统计数据(例如,最小值、最大值、直方图和相关性)并使用它们自动推荐规则以确保数据的新鲜度、准确性和完整性。客户可以安排 AWS Glue Data Quality 在数据发生变化时定期运行,自动分析数据并对质量规则提出更改建议以确保相关性。数据工程师可以配置操作以在出现质量问题时提醒用户或停止数据管道,而无需编写代码。要了解有关 AWS Glue 数据质量的更多信息,请访问 准确性和完整性。客户可以安排 AWS Glue Data Quality 在数据发生变化时定期运行,自动分析数据并对质量规则提出更改建议以确保相关性。数据工程师可以配置操作以在出现质量问题时提醒用户或停止数据管道,而无需编写代码。要了解有关 AWS Glue 数据质量的更多信息,请访问 准确性和完整性。客户可以安排 AWS Glue Data Quality 在数据发生变化时定期运行,自动分析数据并对质量规则提出更改建议以确保相关性。数据工程师可以配置操作以在出现质量问题时提醒用户或停止数据管道,而无需编写代码
  • Amazon Redshift 现在支持多可用区部署:数以万计的 AWS 客户每天使用 Amazon Redshift 共同处理 EB 级数据。为了支持这些客户的关键任务工作负载,Amazon Redshift 提供了可提高可用性和可靠性的功能,例如自动备份以及在几分钟内将集群重新定位到另一个 AZ 的能力。如今,许多数据库使用主备复制模式来支持高可用性,其中单个数据库为实时流量提供服务,备用副本从实时版本复制数据,以备不时之需。基于这些功能,Amazon Redshift 现在提供高可用性配置以实现快速恢复,同时最大限度地降低数据丢失的风险。借助 Amazon Redshift 多可用区,集群部署在多个可用区并使用所有资源来处理读写查询,消除对未充分利用的备用副本的需求,并为客户最大限度地提高性价比。由于多可用区数据仓库仍作为具有一个端点的单个 Amazon Redshift 数据仓库进行管理,因此无需更改应用程序即可保持业务连续性。要了解

Rippling 汇集了薪资、福利、人力资源、IT 等,因此他们的客户可以在一个地方管理员工运营。“随着我们的业务不断增长,我们需要能够超越单个文档数据库节点的限制,”Rippling 的数据工程负责人 Nitin Aggarwal 说。“Amazon DocumentDB 弹性集群将使我们能够快速轻松地扩展以支持每秒数百万次的读写并存储 PB 级数据,从而帮助我们解决这一挑战。随着我们的业务和客户需求的增长,我们很高兴探索 Amazon DocumentDB 弹性集群。”

riskCanvas 是 Genpact 提供的一种软件即服务 (SaaS) 产品,是一种金融犯罪合规解决方案,它利用尖端的大数据、自动化和机器学习技术为其客户提供合规性、效率和自动化。“riskCanvas 的以实体为中心的监控结合了交易监控、外部充实、监视列表筛选和负面新闻,以自动评估风险并仅在客户的真实风险超过预定义阈值时提醒高风险客户,从而大大减少了满足法规遵从性的工作要求。这需要大量多样的分析处理,这些分析处理通常会遇到尖峰和不可预测的数据负载,”riskCanvas 首席技术官兼 Genpact Financial Crimes 技术副总裁 Ryan Skousen 说。

美国金融业监管局 (FINRA) 是与美国公众开展业务的证券公司的监管机构,负责监管股票、债券和期权交易。FINRA 高级主管 Ratnakar Korem 表示:“在 FINRA,我们在 Amazon Athena 上开发应用程序,使分析师和业务合作伙伴能够安全地查询每天更新的数 TB 的金融交易数据。” “我们对 Amazon Athena for Apache Spark 感到兴奋,它将把我们在 Amazon Athena 上享受的速度和易用性带到我们的按需和批量分析中。这种无服务器功能将使 FINRA 能够对大数据进行分析,而无需显式定义计算资源和调整 Apache Spark 性能的开销。

美国联合航空公司经营着庞大的国内和国际航线网络,横跨美国和所有六大洲的大大小小的城市。“联合航空公司正在为我们的客户和员工构建数百个数据和分析驱动的工具,这使得管理和维护数据质量对我们的运营至关重要,”联合航空公司数据工程总监 Sarang Bapat 说。“我们对 AWS Glue 数据质量感到兴奋,这将使我们能够在 几分钟内自动识别、分析数据质量问题并采取行动。这将帮助我们做出明智、及时和准确的决策,并在手动识别和修复所有数据问题方面节省无数时间。”

Janssen Pharmaceuticals 是 Johnson & Johnson 的子公司,致力于研究和生产药品,重点关注患者和医疗保健行业不断变化的需求。“Janssen Pharmaceutical 使用 Amazon Redshift 为我们的数据科学家、数据管理员、业务用户和外部利益相关者提供重要的洞察力,从而推动重要的业务决策,”Janssen Pharmaceutical Companies of Johnson & Johnson 信息技术总监 Shyam Mohapatra 说。“借助 Amazon Redshift Multi-AZ,我们可以确信我们的数据仓库将可用,而不会出现任何可能延迟或影响我们做出重要业务决策的能力的中断。”

关于亚马逊网络服务

15 年来,Amazon Web Services 一直是世界上最全面、应用最广泛的云产品。AWS 一直在不断扩展其服务以支持几乎所有云工作负载,现在它拥有 200 多项功能齐全的服务,涵盖计算、存储、数据库、网络、分析、机器学习和人工智能 (AI)、物联网 (IoT) 、移动、安全、混合、虚拟和增强现实(VR 和 AR)、媒体和应用程序开发、部署和管理来自 30 个地理区域内的 96 个可用区,并宣布计划在 30 个地区增加 15 个可用区和 5 个 AWS 区域澳大利亚、加拿大、以色列、新西兰和泰国。数百万客户——包括发展最快的初创公司、最大的企业、和领先的政府机构——信任 AWS 来为其基础设施提供支持,变得更加敏捷并降低成本。

亚马逊遵循四项原则:客户至上而非竞争对手关注、对发明的热情、对卓越运营的承诺以及长期思考。亚马逊努力成为地球上最以客户为中心的公司、地球上最好的雇主和地球上最安全的工作场所。客户评论、一键式购物、个性化推荐、Prime、Amazon Fulfillment、AWS、Kindle Direct Publishing、Kindle、Career Choice、Fire 平板电脑、Fire TV、Amazon Echo、Alexa、Just Walk Out 技术、Amazon Studios 和 The Climate Pledge 是亚马逊首创的一些东西。


文章来源:https://www.marketscreener.com/quote/stock/AMAZON-COM-INC-12864605/news/AWS-Announces-Five-New-Database-and-Analytics-Capabilities-42445324/

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论