
Amazon SageMaker新增14种内置可视化ETL转换功能,包括:“时间戳格式化”、“字符串拆分”、“正则表达式提取”、“自动平衡处理”、“UUID(通用唯一标识符)”、“标识符”、“列转行(逆透视)”、“行转列(透视)”、“JSON列解析”、“JSON路径提取”、“查找”、“条件路由器”、“路由组”和“排序”。借助这些转换功能,ETL开发人员无需编写自定义代码即可快速构建更复杂的数据管道,轻松完成常见的转换任务。
此外,Amazon SageMaker Lakehouse节点现已支持Amazon S3 Tables,用户能够灵活地跨Amazon S3 Tables就地访问和预览数据。

Amazon SageMaker中的可视化ETL为使用Amazon Q Developer构建ETL流和创作流提供了拖放界面。每个新的可视化ETL转换都满足了独特的数据处理需求。例如:
使用“标识符”为数据集中的每一行分配一个数字标识符;
使用“JSON列解析”转换JSON字符串,这允许用户将JSON字符串转换为数据结构或数组;
使用“JSON路径提取”转换仅提取用户需要的JSON路径。
上述新增功能现均可在亚马逊云科技Amazon SageMaker可用区域中使用。请访问支持区域列表以获取最新的可用性信息。了解更多信息,请访问Amazon SageMaker官方文档。
支持区域列表:
https://docs.aws.amazon.com/sagemaker-unified-studio/latest/adminguide/supported-regions.html
Amazon SageMaker官方文档:
https://docs.aws.amazon.com/sagemaker-unified-studio/latest/userguide/visual-etl-supported-transforms.html













期待你的分享 收藏 在看 点赞!
亚马逊的一小步,云计算的一大步!

点击阅读原文,获取更多精彩内容!




