案例研究
DX团队选择了Alluxio——为各类数据驱动型应用提供位于存储和计算引擎之间的中间层,Alluxio可
充当数据从AWS 传输到本地时的通用数据访问层。
✓ 通过缓存减少混合云中的数据副本。Alluxio为本地运行的Trino引擎在查询AWSS3中的
数据时提供缓存。Alluxio 缓存热数据并将频繁访问的数据提供给 Trino,无需再将数据从云端
拷贝到本地存储。
✓ 提供可连接计算和存储的灵活API。Alluxio 将来自应用程序的数据访问请求转换为底层存
储接口。本地应用可以继续使用HDFSAPI,无需针对S3重新编程。因此,应用程序不再需要针
对特定的存储类型进行适配。
✓ 提供可与ApacheRanger集成的通用安全模式。Alluxio 可通过Ranger 插件与Apache
Ranger 进行集成,因此 Comcast 可以使用本地安全基础设施并继续在云上执行相同的访问控
制策略。
2/3
✓ 频繁访问S3会产生高昂的流量成本。查询公有云上的数据会产生网络流量成本,从而显著
增加数据平台的长期TCO(总拥有成本)。
✓ 数据拷贝既复杂又耗费资源。由于远程访问大型数据集会显著影响性能,因此团队不得不将
数据拷贝到本地存储,这一过程会耗费大量资源、复杂且容易出错。
✓ 存储协议缺乏统一的数据访问模式。本地和公有云上部署的应用程序与存储协议不匹配,
本地应用需重新编程后才能与云存储兼容。
解决方案:无缝、安全的混合云数据访问
<diagram link>
评论