暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

如果Greenplum真的不开源了,国产数据库厂商中谁会更受益

事件背景

昨天一早圈内就有关于Greenplum不再开源的消息,Greenplum自被博通收购起,进行了多次大规模裁员,昨天突然发现github仓库突然无法访问。

此事后经部分人证实是Greenplum代码被归档到另外一个地址,归档地址为https://github.com/greenplum-db/gpdb-archive。这意味着有可能Greenplum后续将不再继续维护开源代码,不过这只是猜测,未得到官方的证实。

关于Greenplum

Greenplum是一款非常优秀的MPP数据库,采用Shared-Nothing架构,可以管理和处理分布在多个不同主机上的大规模数据集。对于Greenplum数据库来说,一个集群是由多个独立的PostgreSQL实例构成的,它们分布在不同的主机上,实例之间协同工作,用户可以像使用一个普通的单机数据库进行访问和执行SQL操作。Master是整个系统的访问入口,负责处理客户端的连接和SQL命令、协调系统中其他实例协同工作,计算实例负责管理和处理具体的业务数据,并将处理结果反馈给Master

Greenplum的发展历程如下:

l Greenplum 基于开源数据库 PostgreSQL 而构建。Greenplum PostgreSQL 版本保持同步,直到它从 PostgreSQL 8.2.15 版本中分叉出来。

l 2007年,Greenplum 发布了 3.0 版本,与 PostgreSQL 分叉。

l 20107月,EMC 收购了 Greenplum20105月,Greenplum 4.0 版本发布,9 PostgreSQL 9.0 发布。

l 2012年,EMC 收购了 Pivotal Labs20134月,从 EMC 剥离,分拆出来的公司名为 Pivotal Software

l 20152月,Pivotal 宣布开源 GemFire, HAWQ  Greenplum Database。(遵从 Apache-2.0 开源协议)

l 2019年,被 VMWare 收购,Pivotal 品牌更名为 VMWare Tanzu

l 2023年,被 Broadcom 收购。

如果Greenplum不开源,哪些国产数据库会受益

数据库按照业务模型分类可以分为OLTPOLAP以及HTAPOLTP侧重交易,比如银行的核心交易类系统,进行存取款、转账、支付等业务,通过操作并发较高;OLAP侧重分析,比如银行的数据仓库系统,进行批量数据转换、统计、关联分析等业务,通常操作并发较低。

Greenplum是一款典型的OLAP数据库,主要适用于偏数据仓库、数据分析类系统。从墨天轮排行榜中筛选数据处理类型为AP的数据库,可以看到有30+ 产品。这些产品按照技术路线不同,可以划分为几大类:

1. 基于Greenplum二次开发或架构升级

国产数据库中有一些产品是直接基于Greenplum进行二次开发的,比如阿里的ADB、金仓的KADB、瀚高的HGDW、易鲸捷的QianBaseMPP等,它们主要定位是在保持原有Greenplum功能不变的情况下在功能完善性、性能优化、高可用性、容灾能力、周边工具等方面进行增强。

还有一些产品是基于Greenplum的内核进行产品架构的升级,比如将Greenplum存算一体的架构修改为存算分离的架构,底层可以支持S3存储,Greenplum原有的内核只做为计算层来使用。这样的存算分离实现解决了原有Greenplum横向扩展瓶颈的问题,此类产品有酷克的HashData、拓数派的PieCloudDB等。

不管是基于Greenplum二次开发还是进行架构改进,这一类的数据库他们对原有GreenplumPostgreSQL语法的兼容性上面是比较好的,适合于原有Greenplum的平替。

2. 完全自研的OLAP产品

国产OLAP数据库产品中做的最早的产品非南大通的GBase 8a莫属,这是一款完全自研发的产品,也在国内的OLAP市场中占据相当大的席位。

GBase 8a可以算是国产OLAP数据库的一个典型,下图专门为其整理了一张关于南大通用的产品发展历程。

3. 新兴OLAP产品,基于DorisClickhouse系列进行二次开发

随首OLAP市场不断发展,产品也在不断的迭代。近几年发现DorisClickhouse突然在OLAP市场领域变得火热,对传统OLAP产品产生了相当大的冲击。

国内也开始有一些厂商开始基于DorisClickhouse进行二次开发,Doris系列主要有飞轮科技的SelectDB较为有名。

4. 底层基于Hadoop系列的产品

Hadoop2015年左右还是非常火热的,当时也有不少产品基于Hadoop开发OLAP数据库,比如星环科技的大数据产品、东方国信的CirroData等,不过Hadoop因为维护较为复杂,基于HadoopOLAP产品未来发展怎样还不太明了。

5. 其它基于PG系实现的OLAP产品

市面上也有一些OLAP的产品,他们兼容PostgreSQL语法。有些是基于postgresql-xc,最典型的就是华为的GaussDB DWS和腾讯的TDSQL-A,它们基本上也可以很方便的实现对PG系或Greenplum的平滑迁移;有些是基于Citus,如虚谷数据库;有些是基于Hawq,如OushuDB

6. 其它分类

除了上述几类,可以明确技术路线的产品,还有一些产品笔者还未来得及深究是自研还是基于某个技术路线,如有读者了解也可以私信给作者。

以上均为根据笔者个人理解做的总结,如有描述错误还请读者见谅。我想表达的主要观点是,如果Greenplum这个流行的分析型数据库真的不开源了,那么国内一些基于Greenplum的用户可能会慢慢转向这些定位做OLAP场景的产品之上,这对这些国产数据库无可厚非是一个大利好。不过话说回来,打铁还需要自身硬,这么多的OLAP国产数据库产品,哪些能真正的走出来,这就需要各个厂商从产品研发、技术支持、文档等诸多方面有足够的竞争力。

文章转载自数据源的技术后花园,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论