暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

中国对PostgreSQL的贡献约等于零吗?

雨生云计算 2024-01-08
155

飞总今天发了一篇《2023年,中国对PostgreSQL的贡献≈0!!!》,振聋发聩。所以我特意去扫了一遍 PostgreSQL 生态的开源项目,看一看这里中国人或者中国公司作为主导者,或主要贡献者的到底有多少。

内核贡献者

不幸的是,也许让飞总言中了 —— 对于 PostgreSQL 这样堪称全世界最成功的开源项目之一:没有什么中国的公司,中国人,在里面扮演了重要的角色 —— 别说 PostgreSQL 核心组(Core Team)了,就连一个主要贡献者(Major Contributor)都没有。当然可以出于政治正确的原因,把来自中国台湾的主要贡献者 Julien Rouhaud 算进去 —— 但这就有点自欺欺人了。

PostgreSQL全球贡献者名单

次要贡献者中,并非没有来自中国的身影。比如《PostgreSQL国际社区授予PG 16版本贡献者荣誉奖章》里就有 15 位中国人的身影。我们也经常能看到 Pivotal 系,阿里,瀚高,成都文武等几个公司的人出现在其中。作出自己的贡献。

不过从 PostgreSQL 社区的观点来看  —— 比如核心组成员 Jonathan Katz的《展望PostgreSQL的2024》,PostgreSQL 社区不仅仅关乎在数据库内核代码仓库,而关乎整个社区的方方面面 —— 包括相关的开源项目活动和社区发展。那么在这方面中国又做的怎么样呢?

生态开源项目

OSSRank 是一个收录开源项目的网站,其中收录了 188个 PostgreSQL 生态开源项目。我依次扫过了这 188 个项目的贡献者名单,看看有没有中国公司/中国人主导的开源项目。标准很简单:贡献者前五名,或者只要至少有十几条贡献的,名字疑似中文或难以确定的贡献者,我就点进去看。

https://ossrank.com/cat/368-postgresql-extension


可惜的是,在这个榜单上的 PG生态开源项目中,只有四个项目满足这一标准,分别是:


36名 Pigsty:冯若航@北京

51名 duckdb_fdw:alitrack@杭州

75名 zhparser:amutu@深圳

118名 pg_roaringbitmap:陈华军@苏宁


这几个项目我都很熟悉,Pigsty 就是我自己写的,提供开源PG发行版与本地RDS。duckdb_fdw
 提供对 duckdb 的外部数据源包装器。zhparser
 提供中文分词能力,pg_roaringbitmap
 提供 RoaringBitmap 压缩位图数据类型,这俩扩展还是我自己编译打包发行,收录在 Pigsty 扩展包里的。

当然,你还是可以把台北的 PG 主要贡献者 Julien Rouhaud 算进来。那么又多了五个项目:Powa, HypoPG, pg_qualstats, pg_stat_kcache, pg_track_settings ,只不过还是那句话:自欺欺人罢了。

活动与社区发展

那么 PostgreSQL 的社区建设与活动又如何呢?相比国际同行,PostgreSQL 在中国的使用率是严重偏低的。例如在2023年全球开发者调研中, PostgreSQL 已经超越 MySQL 成为最流行的数据库了( 45.6% vs 41.1%,专业开发者中更是达到 49.1%)。但是在中国,MySQL 的用户群/实例数/流行度总体是 PostgreSQL 的五倍,与全球水平严重脱节,说一句社区失职并不为过。

中国确实有不少关于 PostgreSQL 的活动,比如每年的 PostgreSQL中国技术大会,各种沙龙与城市巡讲。不过很多活动都沦为厂商推销产品的展销会,纯技术或者管理最佳实践越来越少,这一点也是很让人扼腕。

当然,这些现象也可能跟中国搞信创安可自主可控有关。近三百多款“国产数据库”,有百分之三四十是基于 PostgreSQL 换皮、套壳、魔改的。中国基于开源产品 “研发” 了那么多的数据库,而绝大多数却没有对开源社区有任何方式上的回馈 —— 反而经常出现分裂社区,劣币驱逐良币的情况。

如果这些是真的自主可控解决卡脖子问题也就算了。然而问题在于,和真正吃了制裁的俄罗斯一比 —— 人家就是开源的 PostgreSQL 自主替代吃遍天,没有这种乱象呢?

再这么大炼数据库搞下去,恐怕美国不制裁,中国自己就脱离开源社区球籍 —— 断了技术输液管,开心的只能是垄断关系户,而受损的是用户和国家了。


《数据库真被卡脖子了吗?》


参考阅读

展望PostgreSQL的2024 (Jonathan Katz)

2023年度数据库:PostgreSQL (DB-Engine)

PGSQL x Pigsty: 数据库全能王来了
PostgreSQL:世界上最成功的数据库
AI大模型与向量数据库 PGVECTOR
更好的开源RDS替代:Pigsty
PostgreSQL 到底有多强?
为什么PostgreSQL是最成功的数据库?
PG好处都有啥?

MySQL的正确性为何如此拉垮?

数据库应该放入K8S里吗?
把PG放入Docker是一个好主意吗?
向量数据库凉了吗?
EL系操作系统发行版哪家强?
基础软件到底需要什么样的自主可控?
如何看待 MySQL vs PGSQL 直播闹剧
向量是新的JSON 【译评】
分布式数据库是伪需求吗?
数据库需求层次金字塔

重新拿回计算机硬件的红利

文章转载自雨生云计算,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论