CelerData 是面向现代实时企业的统一分析平台,正在发布其企业分析平台的最新版本 CelerData 第 3 版,该平台将继续为企业的高性能分析提供支持。
CelerData 3 以开源、MPP SQL 数据库、StarRocks 为基础,允许 Lakehouse 用户执行高性能分析,而无需将数据提取到中央数据仓库中。与开放表格式(包括 Delta Lake、Iceberg 和 Hudi)的集成消除了这种数据摄取需求。
此外,用户可以通过实时查询流数据和历史数据来执行分析,从而推动简化的数据架构并减少 Lakehouse 分析的时间支出。企业不再需要单独的流分析平台;据该公司称,CelerData 3 将流数据分析和数据湖分析集中到一个平台上。
“数据湖屋通过引入 ACID 控制、表格式和数据治理,为数据湖架构增加了关键功能,”CelerData 首席执行官 James Li 说。“然而,Lakehouse 的分析能力仍然有限且成本高昂。大多数查询引擎都难以支持交互式临时查询,无法支持实时分析,并且在面对大量并发用户时会崩溃。”
据供应商称,与其他常见查询引擎不同,查询性能至少提高了 3 倍——同时节省了基础设施成本,并以 10,000 QPS(每秒查询)的速度支持数千个并发用户。
CelerData 还允许用户将数据转换为湖上自己的存储格式,并提供多表物化视图和本地缓存层,确保优化的性能和简化的数据管道。可以在 CelerData 中摄取和转换原始数据,进一步简化数据处理管道。
此更新的原生云架构、资源和工作负载隔离以及云中的多可用区可用性为将数据湖屋应用于无数用例提供了巨大的机会;它进一步提高了可靠性,同时限制了存储成本。
“尽管在支持数据湖的底层基础设施方面存在一些挑战,但组织仍在继续寻找能够正面应对这些挑战的解决方案和方法。他们了解组织在以正确的方式实施数据湖时可以实现的价值,”ESG 首席分析师 Mike Leone 说。“在组织今天遇到的所有数据湖环境挑战中,我们的研究表明最大的挑战是数据放置的管理、优化和自动化。借助 CelerData 通过与 Iceberg 和 Hudi 等通用表格格式的集成对 Lakehouse 架构的支持,数据 Lakehouse 现在可以选择进行高性能分析,而无需将数据引入中央数据仓库。”
CelerData 的最新版本将于 2023 年 4 月上旬全面上市。
文章来源:https://www.dbta.com/Editorial/News-Flashes/CelerData-3-Bolsters-Data-Lake-Analytics-with-Centralized-High-Performance-Updates-157637.aspx
作者:Sydney Blanchard