2024年4月27日,HOW 2026中国数据库开源发展峰会暨PostgreSQL高峰论坛在济南举行。会议期间,瀚高数据库创始人苗健接受媒体专访,围绕开源生态、人才战略以及“信创+AI”双轮驱动等话题,分享了其在中国数据库产业二十余年的实践与思考。
选择开源:一条被验证的商业化道路
回顾国内数据库产业的发展历程,早期“从零自研”是一条充满理想主义却异常艰难的道路。苗健指出,当时不少前辈投入大量精力做出了数据库原型,但在产品成熟度、生态兼容性和商业化推广方面都面临巨大挑战。
“对于像瀚高这样的创业公司,没有强大的资源支持,选择开源是当时唯一一条在商业上可行的路。”苗健表示,相较MySQL等开源数据库,PostgreSQL的开放协议为商业化封装和二次开发提供了更广阔的法律空间。更重要的是,当时美国已有头部企业基于PostgreSQL构建了成功的商业模式,这为国内厂商提供了极具价值的参考范本。
从今天的视角回看,这一选择已得到广泛验证。包括华为、腾讯、阿里在内的国内主流数据库厂商,均以不同形式基于开源代码进行商业化封装。“开源释放的市场机会是巨大的,”苗健强调。
从更深层次看,选择开源不仅是成本考量,也是产业生态的理性选择。数据库作为基础软件,其价值高度依赖上下游工具链和应用生态的成熟度。站在巨人的肩膀上,借助全球开源社区的力量进行迭代创新,是一条被反复验证的高效路径。
参与社区:从“技术获取”到“生态引领”的三级跳
瀚高参与PostgreSQL社区的历程,可划分为三个关键阶段:
- 技术获取期:国内PostgreSQL生态尚未兴起,企业通过购买海外公司的服务与培训获取技术资源。
- 深耕参与期:加大技术投入、提交代码贡献,并通过设立联络点加强与社区的连接。
- 生态引领期:将战略重心转向国内生态建设,持续组织数百人规模的技术大会,推动本土社区发展。
苗健给出了一组数据:在全球PostgreSQL国际社区活跃开发者中,中国开发者的人数已从过去的十几人增长至近50人,两三年内占比有望达到50%。但他也清醒地指出,数量增长很快,但在查询优化器、存储引擎等核心模块的贡献度提升仍需时日。
这一进程反映了中国科技企业在全球开源体系中角色的根本转变——从单纯的“使用者”到积极的“贡献者”,再到部分领域的“规则参与制定者”。
破解人才困局:AI时代的“能源危机”
在AI技术狂飙突进的当下,一个被忽视的结构性矛盾正在浮出水面:底层数据库人才的严重短缺。
“当前面临的不仅是人才断层问题,更深层的是对数据库认知的偏差。”苗健指出,AI、大数据等应用层技术备受追捧,但其底层运作高度依赖数据库的支撑。然而,数据库内核技术学习周期长、门槛高,国内开设相关课程的高校不足10所。即便部分高校开课,学生也多止步于完成课程和毕业设计,对底层技术理解较浅,毕业后从事相关工作的意愿和能力明显不足。
这种供需错配导致了一个尴尬的现实:尽管AI对高质量数据的需求如饥似渴,精通数据底层逻辑的技术专家却极度稀缺。“若将AI比作发动机,数据便是能源,”苗健比喻道,“能源的品质越高,发动机效率越高,AI输出的效果就越好。”
“双轮驱动”与全球化视野
在信创产业爆发和AI技术变革的双重背景下,瀚高提出了“双轮驱动”战略——坚持开源生态与商业化产品并行,既要扎根技术研发,也要打通商业闭环。
苗健透露,瀚高在医疗、能源、地理信息等关键领域已形成行业领先优势。以河南科技大学第一附属医院为例,医院43个核心系统经过62轮演练后平稳迁移至瀚高数据库,验证了国产数据库在关键民生场景的可靠性。
在全球化布局方面,瀚高近年来加快了出海步伐。苗健表示,东南亚、中东等新兴市场对数据库产品的需求正在快速增长,国产数据库凭借高性价比和灵活的服务模式,具备较强的竞争优势。
结语
从最初基于开源进行商业化探索,到如今在PostgreSQL国际社区扮演重要角色,再到布局AI时代的技术栈,瀚高的发展历程折射出中国基础软件产业的整体跃迁。
在苗健看来,国产数据库的竞争已从“单点突围”进入“生态体系”比拼的新阶段。能否构建起繁荣的开发者社区、完善的人才培养体系以及开放的合作伙伴网络,将决定企业在下一个十年的竞争身位。




