2022年12月8日,北京飞轮数据科技有限公司(简称:Select DB)首次召开以“为数而生因云而新”为主题的线上发布会,正式发布新一代云原生实时数仓Select DB Cloud。这是一款面向企业用户推出的运行在多云之上、全托管且SaaS化的云数据仓库,如今已上线阿里云、腾讯云、华为云和AWS。作为Apache Doris的商业化公司,这也是Select DB成立一年来,基于Apache Doris内核进行创新研发后,推出的首款商业化云端产品。
SelectDB Cloud 极致性价比

极致性价比背后的“黑科技”
查询引擎的优化:基于 MPP 查询引擎进行优化,支持节点间和节点内并行执行;支持多张大表的分布式 shuffle join;;同时还支持类似 runtime filter 等动态执行技术,通过动态调整执行达到最优的执行效率。通过 colocate join 和 bucket shuffle join 优化能够减少数据传输,提升 join 性能。 高效的数据处理:采用了列式内存布局,向量化计算框架。大幅减少了虚函数调用,提高了 cache 命中率,高效利用了 simd 指令,从而使得算子的性能提升数十倍。 多种存储模式:采用了列式存储,使得编码、压缩、处理都非常高效;支持多种索引结构来做数据剪枝,加速数据扫描。支持物化视图,有效加速查询时的效率;支持多种存储模型。 智能优化策略:采用了 RBO 和 CBO 结合的智能优化器。即将发布的短路径优化,还能够支持数万 QPS 的并发点查。 云原生架构:SelectDB Cloud 云原生架构实现了本地磁盘缓存和对象存储的分层分级存储引擎 ——这样不同层级的存储成本带来综合成本大幅下降;同时在云原生架构实现了计算节点的分离和弹性,得以令计算资源的随需弹性扩缩容
SelectDB Cloud 融合统一

融合统一背后的“黑科技”
混合负载:SelectDB Cloud 支持传统 OLAP 场景 (实时报表和 Adhoc 分析等),也支持批量数据处理(ETL/ELT)。开发者在将大批量的离线 ETL 变成实时、小批量和增量的 ETL后,SelectDB Cloud 能够利用全内存的框架和向量化的引擎来更加高效的处理数据,可以达到几十倍的性能提升。开发者通过简单、标准的 SQL 语句就可以完成数据加工,SelectDB Cloud 也支持 Java UDF 来完成更加个性化的数据处理逻辑。同时,在云上 SelectDB Cloud 也很便捷的使用单独的 ETL 集群来做隔离。 结构化/半结构化支持:SelectDB Cloud 高效原生支持半结构化数据的高效存储和检索分析,在降低了系统复杂性的同时明显提升了成本和性能的收益。SelectDB Cloud 具有灵活高效存储的能力,支持 Array, JSONB, Map 等复合数据类型和动态 schema 表。同时,SelectDB Cloud 具有丰富索引结构加速检索分析,也能够实现高效分析和处理。 湖仓一体:SelectDB Cloud 还能对已经建设的离线数仓和数据湖进行联邦查询,在实现高性能的同时,不需要迁移历史数据。SelectDB Cloud 支持便捷的元数据打通,免去了手动创建外表的繁琐,同时能够对热元数据自动 cache,并且能够支持手动和自动刷新;同时,SelectDB Cloud 也支持多种外表的联邦查询 (Hive, Iceberg, Hudi 关系型数据库,ES,以及各种支持 HMS 协议的云数仓)。
SelectDB Cloud 简单易用
SelectDB Cloud 具有简单易用的特性,它能够大幅度降低企业技术团队的学习、使用门槛和开发周期,更加高效的释放数据生产力,助力业务发展和更迭。目前,SelectDB Cloud 是领域中少有支持 MySQL 连接协议的数仓。在如今的事务处理领域,MySQL 已经被各大公司广泛采用,基于此,用户可以使用 MySQL Client、JDBC 和 DBeaver 来连接使用 SelectDB Cloud,这对于用户来说节省了很多学习成本,更易于上手,兼容性也更好;另外,SelecDB Cloud 还通过可视化控制台为开发者和管理者提供了许多常规、高频的功能来支持不同角色对大量的日常管理任务;除此之外,SelectDB Cloud还可以提供丰富易用的数据导入方式:包括 HTTP Load、Stage Load 和帮助周边大数据生态工具进行连接导入的 Connector 插件,这些功能为企业在数据分析全链路过程带来简单易用的体验。




