
作为年度数据库领域的盛会,DTCC 于8月16日到18日在北京召开。作为疫情之后 DTCC 首次线下召开的大会,吸引了众多数据库厂商及广大数据库从业者参与。在为期三天的会议中,针对数据库行业发展、技术趋势、用户实践等做方面展开探讨。因工作关系,个人只参加了半天,一方面跟很多老朋友许久未见,聊聊天;一方面也了解下国内各数据库厂商的产品发展情况。本文仅从个人角度,谈谈对本次大会的一些观感,仅供参考。
本次大会吸引了数十家国内数据库厂商参与,既包括传统数据库厂商、也包括云厂商、新兴厂商及周边工具厂商。与之前大会相比,此次参会厂商呈现几个特点。
❖ 国进外退,差异明显
此次参与的厂商,几乎全部来自于国内(仅有一家韩国工具厂商)。不仅是大会的参与方,包括演讲主题都均为国内厂商及行业用户。海外厂商日渐声微,其实这一趋势从最近几年会议都可见到。这也是与当前国内数据库行业整体发展较快、海外厂商陆续退出中国不无关系。
❖ 新老更替,策略使然
在此次参会厂商中,少了一些数据库行业的老面孔,但也增加了不少新面孔。如之前在大会上常见的PingCAP、巨杉、易鲸捷等不见了踪影;取而代之的如天翼云、字节等厂商参与其中。造成这一现象的原因,一方面是各厂商的市场运营策略不同所致,另一方面也不排除数据库行业会议近期扎推,造成一定的分流。
❖ 场景深化,渐入佳境
随着国产数据库在企业内使用场景愈发广泛,其应用开始进入深水区,对国产数据库也提出了更高的要求。本次会议中关于迁移、替换、优化类的话题更加集中,厂商也纷纷拿出了对应的解决方案。这对于参会者来说,无疑非常具有现实应用意义。在一些重点行业领域,如金融,其不同业务系统对数据库的要求差异很大,厂商通过多年的积累已经慢慢总结沉淀出一些规律,这一方面指导产品功能的演进,另一方面为更大规模的推广具备重大意义。
从参与大会的各厂商所带来的产品和解决方案来看,呈现出若干技术热点。大致概述起来,有以下几个方面:
❖ 多场景多模式
随着国产数据库在企业内更多场景的使用,对数据库架构提出了更高的要求。简单将数据库分为单机、分布式是无法满足企业的多场景需求,因而衍生出多种不同模式。这些默认充分融合了 Oracle、MySQL 这些架构的优点,逐步形成了以单机、主备(读写分离)、共享储存(读写分离)、共享存储(多写多读)、MPP 并行处理等多种模式。很多厂商纷纷推出的多种架构的支持,特别是共享存储的多写多读,多家厂商均推出这一架构产品,仿照 Oracle RAC 的模式,提供有限存储规模下的高可用性、高性能,以期达到平滑替换 Oracle 数据库的目的。
❖ 安全成为标配
安全能力正受到数据库厂商的重视,产品能力上也有所倾斜。从身份鉴别、三权分立、强制访问控制、安全审计,保障用户数据的完整性和保密性;到支持库、表、列级的存储加密及传输加密,支持国内外主流的加密算法(特别是国密算法)和可信计算,以达到国内数据库的高安全级别。有些厂商产品已经达到EAL4+最高安全标准。
❖ 兼容性为刚需
面对替换国外产品的市场环境,对原有产品的兼容能力成为刚需。一方面在内核层面提供对主流数据库如 Oracle 及 MySQL 数据库的语法支持;一方面提供迁移工具实现从对象到数据的迁移,为数据库国产化替代铺平道路。当然这方面任重道远,虽说各家产品都宣称提供很好的兼容,但具体使用体感差异很大。这也对用户做选择造成一定困扰。
❖ 多模成为增量
企业内越来越多的数据被收集利用起来,特别是各种新型结构数据库,这一催生了多模数据库的火热。相对于关系型数据库市场,多模无疑是一个增量,相对竞争较小。产品往往以分布式、多模融合、AI加持为特色的,强调数据高速写入,低成本压缩存储、海量聚合分析、实时在线响应能力。支持包括GIS、时序等多种模式数据,在物联网、车联网、能源等行业有着广泛的应用前景。

❖ HTAP 必选项
HTAP 几乎成为分布式数据库的标配能力,几乎所有的分布式数据库产品都宣称支持在线分离能力。这一方面与当前的市场宣传导向有一定关系,一方面确实 AP 分析能力很难被完全剥离。毕竟原来如 Oracle 这种大型国外商业数据库就是多面手,很难都指望企业再搭建 OLAP 平台,通过ETL传统方式进行解决。
❖ 管理智能化
应对复杂应用场景下的数据库配置调优、故障诊断、风险预警,提供多层次的数据库自适应、自配置、自管理、自调优、自修复的能力,减低数据库维护难度及工作量。很多厂商产品均内置了 AI4DB 的功能,以期减少因引入新数据库对企业造成的成本投入。甚至包括一些第三方厂商也推出了产品,支持对多种数据库实现诊断、优化、排障等能力。类似产品在海外已经拿到了投资,国内产品也有这种可能,特别是面对国内纷繁众多的国产数据库的现状下。
❖ 向量数据库成为风口
近半年来最火的技术领域无疑是大模型,随之而来的也带动了向量数据库的快速发展。海外已经有一批项目获得风投加持快速发展,国内也有不少企业将这一方向作为自己的第二曲线,尝试发展。其商业前景尚不明朗,但确实值得一试。
❖ 可插拔数据库
在会上有某厂商提出的可插拔数据库的理念。材料中说明是通过对不同数据库共有功能的抽象,以一种模块化的方式,建立标准化API,为不同功能的数据库建立统一的数据基座。在不牺牲性能的前提下,将数据库的基础功能统一,通过解耦的方式把具备不同功能的模块进行组装,快速构建一个能使用不同场景和应用的更加灵活的数据库。针对这一产品,我内心是比较存疑的,所谓可插拔数据库听起来很美化,其实现难度如何,是否具有实用价值仍然不明朗。

❖ 生态建设成重点
随着国产库的铺开,是否具备良好的生态圈成为很多企业选择数据库的重点考察因素。国内厂商,特别是老牌的几家传统数据库厂商,非常重视生态建设,通过多年积累,已形成从硬件、平台、中间件、应用系统等多类别较为完善的生态体系。

❖ 开源分支场景化
MySQL 和 PostgreSQL 是目前最为活跃的、也是普及范围最广的两款数据库,但它们都有一个共性特点,都是海外的开源项目。针对这些开源项目的使用,国内特有的或比较突出的功能很难在社区中被快速接纳并解决。于是,便诞生了国外开源项目的国内场景化分支版本的特点。例如以 MySQL 为代表的金融分支 GreatSQL,重点在 MGR、稳定性、并行效率等方面得到增强,万里开源长期提供支持。如以PostgreSQL开源项目为基础,增强其 Oracle 兼容能力而提出的 IvorySQL 开源项目,由数据库厂商瀚高提供支持,为国内生态厂商、用户提供基于开源的中国化的低成本解决方案。当然这些都是由企业主导,未来或由政府、三方机构主导也未可知。

❖ 国产开源商业化
经过多年实践,国产数据库厂商也开始利用开源构建自有生态。前有 openGauss 生态为代表,通过一批商业发行版扩大其生态圈;后有 OceanBase 生态为代表,也开始有商业分发版本的推出。各家都希望通过开源模式,构建并快速扩大使用群体,并通过商业分发版本及服务解决商业闭环逻辑,促进生态的健康持续发展。值得关注的是,openGauss 通过多年积累已取得不俗的成绩,据私下了解商用分发数量已达到可观的规模,有点出人意料。很多数据库服务或工具类厂商,也希望通过这一模式形成自有产品的第二曲线,在国产数据库领域分一杯羹。当然这里还是需要解决所谓开源原厂与商业分发商的利益划分,形成差异化打法,进而通过生态圈扩大,实现双赢。
韩锋频道:
关注技术、管理、随想。
长按扫码可关注








