市场定位
GBase 8a分析型数据库的主要市场是商业分析和商业智能市场。产品主要应用在政府、党委、安全敏感部门、国防、统计、审计、银监、证监等领域,以及电信、金融、电力等拥有海量业务数据的行业。
产品架构

技术特性
• 支持标准Linux 内核:Cent OS,Redhat, Suse等
• 支持基于x86-64和ARM的标准PC服务器
• 支持本地存储(Sata, SAS, SSD etc)
• 支持阵列部署(SAN,NAS)
• 支持SSD,Flash存储介质作为2级I/O缓存
• 持标准SQL
• 提供通用API: JDBC, ODBC,CAPI,ADO.Net
关键指标
• 真正的列存储,数据压缩比最高可达1:30
• 自动提供粗粒度智能索引,高效过滤,膨胀小,免维护
• 可支撑20TB级别的结构化数据
• 支持并行计算,充分利用现代的 SMP 多核 CPU 资源
• 数据加载速度可达到200GB/小时
GBase 8a MPP Cluster是国内首款支持融合数据处理的分布式关系型数据库集群产品。与国外主流的大数据厂商EMC、HP、IBM等,在金融、电信等领域同台竞技,技术实力相当,形成集群双活、大规模集群管理、虚拟集群等特有技术,实现部分特性国际领先优势,已经在人民银行、银监会、证监会、农总行、中行、工行、招行、中移动、中联通、中电信、海关总署、国防某部等几十个行业数百家用户形成规模化应用,总计上线超过10000节点,管理数据超过200PB。
在不断的市场实践和用户反馈中,GBase 8a体现出8个价值,可分为两级:一级价值包括提速、省盘、省钱、成云等核心优势和直接为客户带来的效益,二级价值包括全文、转非、全数据、可视化等产品的创新功能带来的价值。另外,作为国产数据库,GBase 8a与国外同类产品相比,具有非常明显的本地服务优势。
一级价值
提速:查询分析类性能提升10-100倍
省盘:存储空间节省50%-90%
省钱:软硬件投资节省50-90%,节电30%-50%
成云:支持云计算架构,横向扩展能力
二级价值
全文:集成全文检索,管理半结构化数据(云文件)
转非:非结构化数据的结构化提取和转化
全数据:统一处理结构化、半结构化和非结构化数据
可视化:支持GBase BI可视化数据分析平台
GBase 8a MPP Cluster具有联邦构架、海量数据分布式、高效压缩、高效存储结构、智能索引、灵活的数据分布、在线高性能扩展、高并发、高可用、高安全性、易维护、高效加载等核心优势,具体如下:
1. 联邦架构集群部署:基于列存储的完全并行的MPP + Shared Nothing的联邦架构,采用多活Coordinator(Master)节点、数据节点的两级部署结构,避免了单点性能瓶颈和单点故障,对外提供单一的访问地址。Coordinator节点支持最多部署64个;数据节点支持部署300个以上,单数据节点可支持50TB以上裸数据数据量,且所有节点无共享,具有对等计算能力;
2. 海量数据分布式压缩存储:集群支持海量数据存储、查询,支持15PB以上的结构化数据,采用HASH或RANDOM分布策略进行数据分布式存储;同时采用先进的压缩算法,减少存储数据所需的空间,并相应地提高I/O性能;支持实例级、表级、列级三级压缩;支持基于列存储的数据编码及高效压缩技术;理想情况下,压缩比可达1:20以上;
3. 高效存储结构:采用基于列存储、适合分析优化的存储结构;采用免维护的智能索引;支持行列混合存储的存储结构,有效提高列存数据库在SELECT * 场景下的查询性能;
4. 智能索引:采用高性能、免维护的粗粒度智能索引技术,索引建立膨胀率不超过百分之一。智能索引包含基于列的统计信息,在数据检索定位时可被直接使用,有效过滤数据,大幅降低数据库磁盘I/O,大幅提高海量数据的查询性能;
5. 灵活的数据分布:用户可以按照业务场景的需求,自定义数据分布策略,从而在性能、可靠性和灵活性间获得最佳匹配。数据分布策略包括HASH分布和RANDOM分布;
6. 在线高性能扩展:支持集群节点的在线扩容和缩容,效率更高,对业务的影响更小;在线扩展性能大于20TB/小时;
7. 高并发:读写不互斥,支持数据的边加载边查询,并发能力大于1000;
8. 数据高可用:通过冗余机制来保证集群的高可用特性,互备分片间可实现数据自动同步。数据通过副本提供冗余保护,数据的副本机制支持1或2个数据副本,支持用户自定义的数据副本分布方式;自动故障探测和管理,自动同步元数据和业务数据,副本故障不影响集群的可用性,支持故障的自动恢复,无需人工干预;
9.完善的资源管理:通过资源池及资源使用计划的灵活配置,能够实现不同数据库用户的资源隔离,支持对 CPU、内存、磁盘空间、磁盘 IO、并发任务数等关键资源和指标进行管控,能够提供完善的多租户能力。
10. 主备集群高可用:集群支持主备集群高可用模式;支持数据全量、增量同步;支持主备同步回滚机制;支持主备同步错误恢复机制;支持同城灾备;
11. 安全性:提供完善的用户、角色、权限控制策略,提高数据库集群的安全性;支持详尽的审计日志,可配置灵活的审计策略,记录数据库中与数据库操作相关的所有日志,也可以通过图形化的监视工具实现审计管理;支持透明的数据加密:支持数据存储加密,支持数据库密码加密,支持数据加密压缩;支持相关加密函数,如AES_ENCRYPT()、ENCRYPT()、MD5()、SHA1()、SHA()等;支持库内数据脱敏;支持Kerberos认证方式访问集群和外部数据源;
12. 易维护:提供图形化管理及监控工具,以简化管理员对数据库的管理工作;
13. 数据加载高效性:具备数据库并行加载能力,加载速度随节点增加线性增加,基于策略的数据加载模式,集群整体加载速度大于30TB/h;
14. 集群具有数据备份恢复能力,支持全量、增量备份/恢复;
15. Hadoop备份/恢复:支持与Hadoop之间进行数据备份/恢复,将库内数据备份到Hadoop中,或将Hadoop内的数据文件恢复到库内;Hadoop备份/恢复性能大于100TB/h;
16. 标准化:支持SQL 92、SQL 99、SQL 2003 ANSI/ISO 标准,支持ODBC、JDBC、ADO.NET、OLEDB等接口规范;支持C API、Python API、TCL API等接口;支持SQL 2003 OLAP函数。




