GBase 8a广泛应用于各类企事业单位的数据仓库系统、BI系统和决策支持系统。
表的每一列物理上分开存储
• 数据以DC(数据单元)为单位进行组织,存成DC文件
• DC文件依据操作系统的文件大小限制进行分裂和存储
• DC是基本I/O单位,只有查询所涉及到的列才产生I/O
• 每个DC包含65536行数据,数据行数不足时以DC尾块形式单独存放。
• DC尾块不封装、不压缩。
实现库级、表级、列级三级压缩选项
• 压缩算法按数据类型和数据分布不同而优化,自动选择最优压缩算法,灵活平衡性能与压缩比的关系
• 可以对压缩方式进行修改
粗粒度:轻量级索引,索引的建立和维护对系统资源的占用和性能
影响几乎为零
透明性:索引自动建立,并且随数据变化自动更新,无需人工干预
有效性:大大缩小查询和数据物化的范围,迅速定位目标数据集
元数据自动同步,避免单点故障
• 所有调度集群节点的元数据都在后台自动同步,对用户透明自动故障倒换,SQL持续运行
• GCware服务实时探测节点失效并且马上启动故障倒换机制多类日志保障,节点信息同步
• 重新恢复的调度节点根据GCware日志信息恢复到最新的元数据限定故障规模,保护数据安全
• 当调度集群大规模节点故障,达到或超过调度集群节点总数的1/2时,集群为保护元数据安全将停止工作。
数据节点高可用
指表数据按照一定的规则分别存储在不同的节点上,各节点根据预先设定的分
片规则进行备份。
数据高可用
• 支持多副本,最多2个
• 支持指定副本存放位置
多分片机制
• 实现负载均衡
• 解决木桶效应
指定脱敏属性字段
多种脱敏方式
默认脱敏
默认脱敏default()
随机脱敏random(start,end)
自定义脱敏
partial(prefix,padding,suffix)
例:设定prefix为3,suffix为6,
padding字符“XXXX”
哈希脱敏sha()




