优势
更快速
减少部署时间
更快地发布新的应用程序
快速访问数据
更轻松
一次性配置和设置策略,适用于任何地方
跟踪所有数据(包括上下文)以便进行治理
用户可自助服务
更具成本效益
统一的多功能平台
减少数据冗余性和 IT 低效性
统一的管理界面
实时发现和防止网络攻击。为患者提供更有效的治疗。包含工厂、车(舰)队和金融市场的正常运行。如今高价值的使用案例依赖于协同工作的各种数据分析功能。Cloudera 企业版平台提供了以下功能 :
通过数据工程(Data Engineering)加速 ETL 过程,对机器学习模型进行训练
通过数据科学(Data Science)在大数据规模下支持探索性工作负载
提供用于高性能、高并发性 SQL 的分析型数据库
提供用于数据驱动应用程序的操作型数据库,以获得近乎实时的洞察力
提供与第三方应用集成的可扩展服务
大多数业务应用实际上需要上述两个或多个功能结合起来才能对相同的数据集进行操作。这是传统分析环境中面临的一大挑战,应用程序中存在的每个功能都具有独特的安全性,数据管理、治理、存储和采集策略以及独立数据目录。这在瞬态云环境中将更加困难,数据关联(关于数据的数据)不会持续存在,而且在删除集群时可能会丢失。
提供共享的数据体验
Cloudera SDX(共享数据体验)是一个功能强大的软件框架,使多功能数据应用的开发更容易、部署更快、成本更低、也更安全。通过应用驻留在持久对象存储中(而不是瞬态计算节点)有状态的、集中的、一致的数据上下文服务,SDX 可以令数百个不同的工作负载在共享或重叠的数据集上运行。
SDX 是当今 Cloudera 企业版平台的核心要素,能够将不同的工作负载作为统一单元。其由五项单独的功能组成,来共同解决一个真正的难题— 为平台提供共享数据体验来支持多种工作负载和用户交互模型。
功能
客户利益
共享目录
为每个工作负载和访问该平台的用户提供一个模式和沿袭元数据的通用目录,以实现最大效率和生产力。
共享安全
实施统一的、一致的、细粒度的身份验证、授权、加密和合规性控制。
共享治理
轻松发现新数据、了解数据的来源,并跟踪其修改历史。
共享工作负载管理
允许系统管理员分配资源及根据业务需求指配工作负载优先级,分别或集中创建、管理
和优化工作负载。
共享据采集和复制
一次数据采集可供所有功能、应用程序和用户使用,无需额外数据采集管道或数据副本;按需将数据复制到远程位置或直接复制到云端。
云计算中的 SDX
Cloudera SDX 使客户能够更轻松地在云基础架构上部署多功能应用程序,而不会牺牲本地部署的共享数据体验。SDX 在云计算环境中更有价值,因为数据应用程序更倾向于在隔离的基础架构上运行,而且本质上通常是瞬态的。并且,必须为每项作业自动提供和删除整个数据上下文。
如果没有 SDX,每个工作负载都会退化成孤立的安全策略和元数据上下文,成为数据团队管理的噩梦。SDX 使创建支持多功能应用程序的单个逻辑集群成为可能,同时允许每个工作负载充分利用云基础架构的优势。
上图说明了 SDX 如何在云中工作的详细信息。上图由下至上分别为 :
存储层通过共享对象存储实现,只需要一个原始数据副本就可以实现 SDX,从而最大限度地提高效率、安全性和治理性
元数据层由一组共享的元存储和相关的工具实现,以在整个平台上维护一致性的数据目录和策略
计算层的实现是通过在隔离的工作负载集群上运行每个工作负载,使得每个负载都可以对云 IaaS 进行全面优化
通过 Cloudera Manager 实现管理层,轻松创建和管理瞬时性和持久性工作负载
用户界面层通过 Cloudera Altus 实现,使用户能够轻松地在由数据团队管理的共享环境中创建作业和排除作业故障
Cloudera SDX 支持多种公有云、私有云和裸机配置。该服务嵌入在以下 Cloudera 企业版的商业产品中 :
Cloudera 数据科学与数据工程
Cloudera 分析型数据库
Cloudera 操作型数据库
Cloudera 企业数据中心
请点击“阅读全文”进入微站
(更多技术干货、行业动态,请关注【微站】,不定时更新)









