暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

数据库系统的分类和评测研究:列簇式数据库

原创 墨天轮编辑部 2022-11-15
709

定义

列簇式数据库(Wide-Column Database)是一类使用表、行和列进行数据存储(widecolumn store)NoSQL数据库,与关系数据库不同的是,列的名称和格式在同一表中的行与行之间可能不同。 宽列存储可以视为一种二维键值存储。

特性

列簇式数据库针对快速检索数据列进行了优化,通常用于OLAP。 适用于数据库表的列式存储是分析查询性能的一个重要组成部分,因为它极大地降低了整体磁盘 I/O 要求,并减少了需要从磁盘载入的数据量 。 按列存储数据的另一大特点是方便存储结构化和半结构化数据,方便做数据压缩。宽列存储(Wide-column store)不同于早期的列存储(Column-oriented store),因为它们的两级结构不使用列式数据布局。 在真正的列存储中,采用列式数据布局,使得每一列单独存储在磁盘上。 宽列存储通常支持单独存储的列族的概念。 然而,每个这样的列族通常包含多个一起使用的列,类似于传统的关系数据库表。 在给定的列族中,所有数据都以逐行方式存储,这样给定行的列存储在一起,而不是单独存储每一列。与其他 NoSQL 数据库一样,列簇式数据库旨在利用低成本硬件的分布式群集进行横向扩展,进而提高吞吐量,从而使其适用于数据仓库和大数据处理。

评测标准

YCSB++:是专为测试列簇式可扩展存储的数据库,包括并行性测试、弱一致性测试、块上传测试、表的预先分裂、服务器端过滤和访问权限等。 基准测试在多个基准测试客户机之间提供分布式同步,并能够测量最终的一致性、批量加载以及批量写入(如表预拆分)的优化效果。 此外,基准测试还可以测量额外功能(如访问控制)的性能开销,并收集每个集群节点上的资源度量的监控信息。

列簇式数据库业界代表

列簇式数据库业界代表包括BigTable、HBase、Cassandra等。

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论