暂无图片
暂无图片
10
暂无图片
暂无图片
暂无图片

网信办“2022年数字中国发展报告”:我国在数据库等方面取得重要进展

原创 通讯员 2023-05-24
1208

2023年5月23日,国家网信办发布《数字中国发展报告(2022年)》(下称《报告》)。《报告》指出,我国数字技术创新能力持续提升,我国5G实现了技术、产业、网络、应用的全面领先,6G加快研发布局。我国在集成电路、人工智能、高性能计算、EDA、数据库、操作系统等方面取得重要进展。


中国数据库行业发展欣欣向荣

据艾瑞统计,2021年中国数据库市场总规模达286.8亿,较2020年增长16.1%,CAGR(2021-2026e)达13.4%。中国数据库市场虽受疫情影响,但整体稳步增长,由多方面因素促成:1)信创利好,国家对国产数据库的支持力度大;2)需求催化,数字化业务场景带动数据库多元化发展;3)供给侧厂商厚积薄发,技术创新涌现,产品性能显著提升;4)国内用户对基础软件的IT支出和国产数据库的付费意愿逐年提升。


图片


墨天轮数据显示,自2020年以来国产 HTAP 数据库发展迅猛,几乎成为新兴数据库的必选项。


图片


图片

图片


图片



据中国信通院发布的《数据库发展研究报告 2021》统计,2025 年中国的数据库市场规模将达到 688 亿元,5 年年复合增长率达 23.4%。目 前,海外巨头仍占据国内数据库市场较大份额,但国产数据库经历多年沉淀,已经具备初步竞争力。据《中国信创产业发展报告 2021》统计,2020 年数据库国产化率已达 47.4%。根据 IDC 统 计,目前华为、达梦、人大金仓、阿里云等国产数据库软件已经在市场中占有一定份额,未来随 着国产数据库技术不断提升,数据库国产化率有望进一步扩张。从行业来看,2021 年在国内数据 库市场份额中占比最高的是金融行业,达到了 20.2%,其办公系统和一般系统使用我国数据库产 品的机构数量已经超过 40%。


墨天轮数据社区《2022 年中国数据库行业年度分析报告》显示,目前国内数据库有着 249 款产品,单 2022 年就新增了 55 款产品,占比总数量的五分之一。目前分布式技术已成为多数国产数据库的标配,让企业应用能在容量和负载上都能轻松横向扩展,满足了当今时代和市场的需求,也是替换 Oracle 等传统集中式数据库的重要突破口。云原生数据库 34 个,云数据库成为新的竞争力焦点,阿里云、华为云、腾讯云的市场份额有显著增长。



从融资环境上看,数据库产业受资本关注度较高,整体投融资环境向好。2022 年至今已有 17家国产数据库厂商和数据库生态企业获得融资,其中 2014 年后成立的新兴企业有 12 家,占比70.6%;单笔获得过亿元人民币融资的有 11 家,占比 64.7%。相比于 2021 全年融资次数,数据库企业融资次数增长 21.4%。根据披露金额,2022 年融资额度总计约为 80.92 亿元人民币,其中不乏高瓴创投、经纬中国、红杉资本等知名投资方。


初创厂商纷纷涌入非关系型数据库细分赛道,有望带动基于新技术架构的非关系数据库快速发展,据艾瑞咨询预测,2020-2025年以初创厂商为代表的新兴数据库市场规模有望实现高于10倍的增长。


从技术方面看,中国数据库自主创新能力显著增强。目前中国数据库论文数占全球总数 12%,并呈现发文数逐年递增的趋势。(数据库论文能够展现数据库行业最新研究成果,发文数量能够一定程度上体现各发文单位在数据库学术领域、技术钻研上的成就。)阿里巴巴、华为、腾讯、蚂蚁金服等企业和清华大学、香港科技大学、北京大学、香港中文大学、香港大学、浙江大学等高校论文纷纷入选三大顶会,显示我国数据库学术水平国际影响力不断扩大。


国产数据库的支撑体系不断完善。数据库支撑体系包括学术组织、行业支撑组织、人才培训体系三大类。



中国数据库传统厂商积淀深厚,新兴厂商聚焦新兴技术


达梦数据:背靠中国电子,主攻混合型数据库HTAP

背靠 CEC 中国电子,主攻混合型数据库 HTAP。武汉达梦成立于 2000 年,是中国电子信 息产业集团(CEC)旗下基础软件企业,专注于为客户提供以数据库软件、集群软件、云 计算、大数据平台为代表的全栈数据产品及解决方案,产品涵盖数据库、云计算、大数据 三大类。在数据库领域,武汉达梦主攻混合型数据库 HTAP,旨在用一种数据库模式处理客 户所有数据库需求,适合业务广、数据量大的综合型客户使用,目前已掌握数据管理与数 据分析领域的核心前沿技术,拥有全部源代码,具有完全自主知识产权。达梦数据库产品 目前已广泛应用于金融、电力、航空、通信、电子政务等 30 多个行业领域。

达梦主推透明分布式数据库(DMTDD)技术。达梦提出的 DMTDD 技术包括灵活横向扩展、 完整的 SQL 特性支持、多副本数据异地容灾的特点。结合了分布式数据库高可扩展、高可 用、高并发处理能力,并支持传统数据库开发接口和业务开发框架的技术架构。(1)灵活横向扩展:DM8 TDD 采用计算存储分离的系统架构,实现计算、日志、存储三 层分离,可实现各层独立扩展、按需配置设备的特点。(2)完整的 SQL 特性支持:支持多表连接查询、子查询、视图嵌套查询、递归表达式查 询等高级查询语法。提供存储过程、触发器、Package、序列等高级功能特性。(3)多副本数据异地容灾:支持异地部署,通过将数据副本存储在不同的容灾域,实现数 据的异地容灾;日志服务本身具备副本与容灾能力,可在每个数据中心分别部署;数据库 服务在主机房按需部署,在检测到灾害时,即时启动。

新一代分布式数据库 DMDPC 具备极致的横向扩展能力。2022 年,达梦数据发布新一代分 布式数据库产品 DMDPC,DMDPC 数据库无状态计算节点,可随数据库并发压力负载按需 增加或减少节点,具备极致的横向扩展能力。同时 DMDPC 支持分布式事务(满足 ACID 规范)、数据分片的多副本容灾、多机并行协同计算,适用于 HTAP 场景。DMDPC 架构包 括三类节点:1)计划生成节点 SP:对外提供分布式数据库服务,也会分配执行带有汇总 性质以及不包含数据扫描操作的子任务;2)数据存储节点 BP:访问数据并进行简单的过 滤、投影以及分组操作;3)元数据服务器节点 MP:获取 SP、BP 节点的数据字典信息。

新一代分布式数据库 DMDPC 满足金融、电网、交通、工业互联网等多场景需求。1)金融 系统:DMDPC 基于改进的多主机 XA 协议、基于分布式环境的多版本并发控制等技术,保 证了分布式数据库对事务 ACID 规范的支持,满足金融核心业务系统对事物强一致性的需求;2)智慧电网:支持同城异地多活,可有效支持电网在全国多地的部署联网;3)智慧交通:DMDPC 可实现计算资源的按需分配,弹性扩展、支持 GIS 地理信息存储;4)工业互联网:支持100以上的分布式节点且采用多种安全加固措施,可支撑工业互联网的数据安全需求。

人大金仓:背靠 CETC 中国电子科技集团,老牌数据库

背靠 CETC 中国电子科技集团,是成立最早的国产数据库企业。人大金仓背靠 CETC 中国 电子科技集团,由中国人民大学最早一批从事数据库研究的专家于 1999 年发起创立,先后 承担了国家“863”、“核高基”等重大专项。人大金仓专注数据库领域 20 余年,具备出色 的数据库产品研发和服务能力,数据库产品广泛服务于电子政务、国防军工、能源、金融、 电信等 60 余个重点行业和关键领域,截至 2021 年,产品累计装机部署超百万套。

三大数据库产品各具优势,使用多类型应用场景。1)KES:KingbaseES 作为人大金仓的 通用型数据库产品,是一款面向大规模并发交易处理的企业级关系型数据库,严格支持 ACID 特性,具备迁移简单、高度容错、系统自治、兼容性好的突出优势,并提供可覆盖迁 移、开发及运维管理全使用周期的智能便捷工具;2)KADB:KingbaseAnalyticsDB 采用 shared-nothing 分布式架构,是一款具有高性能、高扩展性能力的 MPP 数据库产品,适用 于数据仓库、决策支持、高级分析等分析类应用场景;3)KSOne :是人大金仓自主研发 的 HTAP 分布式数据库,拥有高可靠,高安全,弹性伸缩,高效备份恢复等关键能力,可 以为海量数据、海量并发用户、高负载压力、高连续性要求的业务系统提供强有力支撑。

人大金仓致力于为政务、能源、国防、金融、电信等国家企事业单位提供数据解决方案。人大金仓作为国产数据库领军企业,积极推动与产业链上下游伙伴产品的兼容适配,涵盖 芯片、操作系统、云平台、中间件以及上层软件应用,具备来自上下游 1,300 多家公司超 4,000 份兼容认证,全面适配国家专用项目相关产品。人大金仓在部署模式上提供线下部署 与线上云适配两种形式,云联合方案覆盖主流云厂商。金仓数据库产品广泛服务于电子政 务、国防军工、能源、运营商、金融等 60 余个关键行业,涵盖国家电网、南方电网、中国 人民银行、中国银行、中国邮政、中国移动等重点企事业单位。

阿里 OceanBase:金融级分布式关系数据库,核心代码开源

发端于阿里内部,2021 年正式开源。OceanBase 是由蚂蚁金服、阿里巴巴完全自主研发 的分布式关系型数据库,始创于 2010 年,应用于支付宝全部核心业务以及阿里巴巴淘宝业 务,从 2017 年开始,开始服务外部客户。2020 年 6 月 8 日,蚂蚁集团将自研数据库产品 OceanBase 独立进行公司化运作,同年 9 月,中国工商银行开始采用蚂蚁自研数据库 OceanBase,其对公(法人)理财系统已完成从大型主机到 OceanBase 分布式架构的改 造。2021 年 6 月,OceanBase3.0 版本发布并正式开源;2022 年 8 月,OceanBase4.0 正 式发布,成为业内首个单机分布式一体化数据库。

OceanBase 是金融级分布式关系数据库,具备在线水平扩展能力。OceanBase 是一款针 对特殊巨型复杂网络、超大实时更新数据场景的分布式实时数据库产品,拥有简单易用、 性能高的特点。该产品定位是一款分布式关系数据库,适合于金融、证券等涉及交易、支 付和账务等对高可用、强一致要求较高,同时对性能、成本和扩展性有需求的金融属性场 景,以及各种关系型结构化存储的 OLTP 应用。

OceanBase 产品体系涵盖四大类:1)分布式数据库:包括社区版、企业版、公有云三大 版本,社区版可免费下载,适用于中小企业开发者,企业版适用于追求更高扩展能力、稳 定性的中大型企业,公有云版适用于阿里云、AWS 等全球主流公有云场景;2)图数据库:OceanBase TuGraph 构建了包含图存储、图计算、图学习、图研发平台的完善的图技术体 系,适用于金融、工业、政务等业务场景;3)时序数据库:OceanBase CeresDB 基于 OceanBase 分布式存储引擎,用来存储和管理时间序列数据,适用于物联网 IoT、运维监 控等业务场景;4)工具体系:涵盖数据库评估、迁移、开发、运维等工具。

OceanBase 客户主要集中在银行、保险证券、政企、互联网。OceanBase 最早应用于阿 里集团的淘宝、网商银行、支付宝等业务场景,实现了在互联网、金融交易等业务上的产 品沉淀,目前下游客户主要集中在银行、保险、证券、政企、互联网等领域。以中国工商 银行为例,面对工商银行的 5 级容灾要求,OceanBase 结合不同的副本属性组合实现“数 据库同城双活、异地 RPO=0 的两地三中心方案”的容灾部署,实现了两地三中心的城市级 容灾,解决了容灾标准高、建设成本高、备机房资源浪费等问题,满足 7x24 小时服务要求, 数据库服务器资源利用率达到 75%,降低了整体的投入成本。

华为 GaussDB:AI 原生数据库,拥抱开源生态

AI 原生&支持异构计算。华为 GaussDB 是一个企业级 AI-Native 分布式数据库,可为超大 规模数据管理提供高性价比的通用计算平台,也用于支撑各类数据仓库系统、BI 系统和决 策支持系统,为上层应用的决策分析提供服务。GaussDB 采用 MPP(Massive Parallel Processing))架构,支持行存储与列存储,提供 PB 级别数据量的处理能力。GaussDB 是 全球首款 AI-Native 数据库,能够同时支持 X86、ARM、GPU、NPU 等异构计算,布局全 球 7 大区域,服务金融、政企、互联网、游戏、汽车等行业标杆客户超 2,500 家。

GaussDB 包含三大产品线:关系型数据库、非关系数据库、数据库生态工具/中间件。1) 关系型数据库:包括华为自研的云数据库 GaussDB(for openGauss)、GaussDB(for MySQL)以及非自研的适用于 MySQL、PostergreSQL、SQL Server 的云数据库 RDS;2) 非关系型数据库:包括华为自研的 GaussDB(for Mongo)、GaussDB(for Cassandra)、 GaussDB(for Influx)、GaussDB(for Redis)以及非自研的文档数据库服务 DDS;3)数 据库生态工具/中间件:包括数据复制服务 DRS、管理服务 DAS、数据库和应用迁移 UGO 以及分布式数据库中间件 DDM。

openGauss 拥抱开源。2019 年 9 月,华为宣布开源其 GaussDB 数据库,开源后的产品 命名为 openGauss,2020 年 6 月 openGauss 源代码正式开放并发布 1.0.0 版本,同年 7 月社区关键组织开始运行。openGauss 内核源自 PostgreSQL,代码自研占比超过 74%, 截至 2022 年 6 月开源社区用户超 64 万,贡献者约 3,000 人。基于 openGauss 开放生态, 华为进一步推出分布式云数据库 GaussDB(for openGauss),该产品具备企业级复杂事务 混合负载能力,同时支持分布式事务强一致、同城跨 AZ 部署、数据 0 丢失,支持 1000+ 的计算节点扩展能力、4PB 海量存储,拥有云上高可用、高可靠、高安全、弹性伸缩、一 键部署等关键能力,现已广泛适用于金融、政企、互联网等关键场景。

GaussDB 适应互联网、金融、游戏、汽车等多业务场景。GaussDB(for openGauss)作 为金融级分布式数据库,具有高性能、高弹性、AI-Native 自治的典型特性,广泛应用于金 融业务场景;GaussDB(for MySQL)数据库提供百万级 QPS,性能最高可以达到 MySQL 社区版本的 7 倍、GaussDB(for Mongo) 性能最高可以达到 MongoDB 社区版本的 3 倍, 满足游戏业务场景下弹性伸缩、一键回档、快速开服的业务需求;综合应用 RDS 数据库、 DDS 文档型数据库、数据复制服务 DRS、分布式数据库中间件 DDM 等产品,可构建读写 分离的分布式架构,为互联网行业应用提供分布式解决方案。

巨杉数据库:自研金融级分布式数据库的独立厂商

专注分布式数据库技术研发的自研数据库独立厂商。巨杉数据库成立于 2012 年,是一家专 注分布式数据库技术研发的自研国产基础软件厂商,公司自成立以来,专注数据库产品研 发,坚持从零开始打造原生分布式数据库引擎,经过多年积累,现已推出分布式数据库 DB (实时数据湖)、内容管理平台 CM(多模数据湖)、湖仓融合平台 DP(湖仓一体)三大产 品线,广泛应用于金融、政府、能源、电信、交通等领域,企业用户总数超过 1,000 家。

从商用首发时间看,巨杉数据库是国内最早进行商业化布局的分布式数据库。2012 年, SequoiaDB 巨杉数据库作为独立数据库公司开始研发,进行原生分布式架构布局。2013 年 SequoiaDB v1.0 产品化正式商用并进军企业级领域,开始为客户提供产品及技术服务支持。自研内核具有领先性,支持跨结构化、半结构化、非结构化的多模数据处理。巨杉数据库 坚持自主打造原生分布式数据库引擎,专注数据库技术研发,聚焦金融赛道,致力于以金 融行业为核心,打造安全可靠、高性能,适合全行业通用的分布式数据库产品。巨杉分布 式数据库 SequoiaDB 基于巨杉自研的原生分布式内核,研发出引擎级多模及 STP 逻辑时 钟协议分布式数据库技术,能够实现分布式交易与 ACID 的完全兼容,同时架构及功能特性 与传统数据库完全兼容,提供跨引擎事务支持和一致性保障。SequoiaDB 支持多种级别的 容灾部署形态,如同城双中心、同城三中心、两地三中心、三地五中心等,独创四级熔断 容灾安全保护机制,充分保证数据安全,满足核心交易业务的严苛要求。

湖仓一体平台为数据联通提供解决方案。巨杉推出的湖仓融合平台 SequoiaDP 以分布式数 据库 SequoiaDB、内容管理平台 SequoiaCM 为基础,打破了数据湖与数据仓库割裂的体 系,可以为上层应用提供“一数一源”的数据基础设施。湖仓一体架构除了具备多模能力, 兼容多种结构化数据、半结构化数据和非结构化对象数据引擎以外,还可以提供包括流式 计算、高性能列存分析引擎、跨引擎数据 ACID 一致性等能力,支持 Tableau、Power BI、 帆软、SmartBI 等国内外分析工具,解决了独立建设、管理的数据库数据互不相通的问题。

助力数据库信创生态、支撑体系建设。巨杉数据库积极参与信创生态建设,根据 2021 年信 创产业技术与应用大会,截至 2021 年 3 月,巨杉已经与鲲鹏、飞腾、统信、银河麒麟等产 品完成兼容认证,合作伙伴总数超 50 家,为企业客户打开丰富的上下游产品生态。得益于 引擎级多模的高度兼容,巨杉数据库现已与近百家企业的 200+产品完成了兼容测试与认证, 产品对接时间平均降低到 15 个工作日,为企业客户打开丰富的上下游生态。2019 年,巨杉数据库搭建“巨杉大学”认证与学习体系,讲师团队由巨杉数据库官方的数 据库架构师、资深分布式技术专家以及开源社区技术大咖共同组成。截至 2021 年 6 月,已 有超 180 家金融机构,30 余家知名技术服务开发商参加巨杉大学计划。截至 2020 年底, 经过短短 1 年的发展,巨杉大学已认证工程师超过 1 万人,网站用户注册数量超过 5 万人, 为分布式技术业界发展提供坚实的人才积淀。

PingCAP TiDB:开源分布式关系型数据库

TiDB 为 PingCAP 自主研发的一栈式实时 HTAP 数据库。PingCAP 公司成立于 2015 年, 借鉴 Google Spanner 及 F1 论文的实现,TiDB 在 Github 上开源,从仅有 SQL 层及 KV 层 的 beta 版本到现在已经衍生出庞大家族的 6.0 版本,始终围绕着为用户提供一栈式 OLTP、 OLAP、HTAP 解决方案的目标演进。在内核设计上,TiDB 分布式数据库将整体架构拆分 成了多个模块,各模块之间互相通信,组成完整的 TiDB 系统。与传统的单机数据库相比, TiDB 的纯分布式架构拥有良好的扩展性且具有丰富的工具链生态,覆盖数据迁移、同步、 备份等多种场景。2022 年,TiDB Cloud 正式商用,TiDB 支持本地和云部署两种方式。

TiDB 适应多应用场景。依托纯分布式架构及开源社区,TiDB 持续扩展出丰富的应用场景:1)对数据一致性及高可靠、系统高可用、可扩展性、容灾要求较高的金融场景:TiDB 采 用多副本+Multi-Raft 协议的方式将数据调度到不同的机房、机架、机器,当部分机器出现 故障时系统可自动进行切换;2)对存储容量、可扩展性、并发要求较高的海量数据及高并发的 OLTP 场景:TiDB 采用 计算、存储分离的架构,可对计算、存储分别进行扩容和缩容,计算最大支持 512 节点, 每个节点最大支持 1000 并发,集群容量最大支持 PB 级别;3)Real-time HTAP 场景:TiDB 在 4.0 版本中引入列存储引擎 TiFlash,结合行存储引擎 TiKV 构建真正的 HTAP 数据库,在增加少量存储成本的情况下,可以同一个系统中做联机 交易处理、实时数据分析,极大地节省企业的成本;

4)数据汇聚、二次加工处理的场景:TiDB 通过 ETL 工具或者 TiDB 的同步工具将数据同 步到 TiDB,在 TiDB 中直接生成报表,便于将分散在不同系统中的数据汇总,以便决策层 了解公司的整体业务状况及时做出决策。“开源社区”助力“开源商业化”。PingCAP 拥有丰富的开源社区活动,形成开源社区和自 身研发的有效协同。通过开源及免费策略,快速扩展开发者及技术粉丝用户群体,实现未 来商业变现机会的长期积累。据 GitHub,截至 2022 年 8 月,TiDB 项目在 GitHub 上已 总计获得超 32,000 颗星,超 1,800 位开源代码贡献者,高度活跃的开源社区为 TiDB 产 品发展带来了正向反馈闭环。TiDB 已广泛应用于互联网、游戏、金融、政府等多领域。

星环科技:专注企业级大数据服务,布局分布式数据库

布局分布式数据库,搭建数据服务闭环。星环科技成立于 2013 年,专注于企业级容器云计 算、大数据和人工智能核心平台的研发和服务,目前已形成包括大数据与云基础平台(大 数据基础平台 TDH、数据云平台 TDC)、分布式关系型数据库(ArgoDB、KunDB)、数据 开发与智能分析工具(大数据开发工具 TDS、智能分析工具 Sophon)在内的产品体系。ArgoDB 与 KunDB 分别为分析型、交易型数据库产品:1)ArgoDB:是一款具备多模型、 联邦等特性的高性能分析型分布式数据库,于 2019 年成为全球第四个通过 TPC-DS 基准 测试并经过 TPC 官方审计的数据库产品;2)KunDB:是一款兼容 SQL 标准语言的交易 型分布式数据库,可支持高并发交易场景的核心业务。

ArgoDB 满足数据多模、联邦计算需求。与传统的 MPP 数据库相比,ArgoDB 具有存算解 耦结构,存储和计算独立按需扩缩容,具备更强的可扩展性、一致性、平滑适配云原生架 构等优势。2022 年最新发布的 ArgoDB 5.0 推出新一代的向量化计算引擎和多模存储引擎, 分析能力达到了同类数据库产品 2~10 倍,同时可提供多模分析,拥有实时数据处理、AETP 混合负载、联邦计算、隐私计算等能力,可一站式满足湖仓集一体化建设需求。

KunDB 支持高并发交易场景的核心业务。KunDB 具有业内领先的事务处理性能,SQL 兼 容性以及最新的分布式查询优化技术,支持复杂查询且性能是 MySQL 的 10 倍以上,充分 满足高并发、大数据量的交易型业务场景。升级后 KunDB 3.0 高度兼容 Oracle 语法及 PL/SQL,基于升级的 TSO 全新分布式事务架构,性能领先主流开源 NewSQL 5 倍以上, 分布式查询优化和向量化执行引擎技术支持 TPCH 复杂分析,并提供一体化实时 HTAP, 支持一致性备份恢复及容灾,全面助力数据库国产化升级。

星环科技数据库服务能源、金融、政府、交通等多业务场景。ArgoDB 主要用于构建离线数 据仓库、实时数据仓库、数据集市等数据分析系统,适用于构建能源、物联网、政务等大 数据平台的业务场景。KunDB 适用于对数据具有高并发读写需求,同时需要 ACID 保证的 交易型场景,如金融、电信、能源等核心业务系统;也适用于对数据库有高并发和大容量 存储需求的场景,如物联网、日志存储等系统。此外,公司结合 KunDB 和 ArgoDB 打造了 一体化实时 AETP技术(分析增强型交易库),可以同时支撑交易与分析混合型的业务场景。

达梦数据:背靠中国电子,主攻混合型数据库HTAP

背靠 CEC 中国电子,主攻混合型数据库 HTAP。武汉达梦成立于 2000 年,是中国电子信 息产业集团(CEC)旗下基础软件企业,专注于为客户提供以数据库软件、集群软件、云 计算、大数据平台为代表的全栈数据产品及解决方案,产品涵盖数据库、云计算、大数据 三大类。在数据库领域,武汉达梦主攻混合型数据库 HTAP,旨在用一种数据库模式处理客 户所有数据库需求,适合业务广、数据量大的综合型客户使用,目前已掌握数据管理与数 据分析领域的核心前沿技术,拥有全部源代码,具有完全自主知识产权。达梦数据库产品 目前已广泛应用于金融、电力、航空、通信、电子政务等 30 多个行业领域。

达梦主推透明分布式数据库(DMTDD)技术。达梦提出的 DMTDD 技术包括灵活横向扩展、 完整的 SQL 特性支持、多副本数据异地容灾的特点。结合了分布式数据库高可扩展、高可 用、高并发处理能力,并支持传统数据库开发接口和业务开发框架的技术架构。(1)灵活横向扩展:DM8 TDD 采用计算存储分离的系统架构,实现计算、日志、存储三 层分离,可实现各层独立扩展、按需配置设备的特点。(2)完整的 SQL 特性支持:支持多表连接查询、子查询、视图嵌套查询、递归表达式查 询等高级查询语法。提供存储过程、触发器、Package、序列等高级功能特性。(3)多副本数据异地容灾:支持异地部署,通过将数据副本存储在不同的容灾域,实现数 据的异地容灾;日志服务本身具备副本与容灾能力,可在每个数据中心分别部署;数据库 服务在主机房按需部署,在检测到灾害时,即时启动。

新一代分布式数据库 DMDPC 具备极致的横向扩展能力。2022 年,达梦数据发布新一代分 布式数据库产品 DMDPC,DMDPC 数据库无状态计算节点,可随数据库并发压力负载按需 增加或减少节点,具备极致的横向扩展能力。同时 DMDPC 支持分布式事务(满足 ACID 规范)、数据分片的多副本容灾、多机并行协同计算,适用于 HTAP 场景。DMDPC 架构包 括三类节点:1)计划生成节点 SP:对外提供分布式数据库服务,也会分配执行带有汇总 性质以及不包含数据扫描操作的子任务;2)数据存储节点 BP:访问数据并进行简单的过 滤、投影以及分组操作;3)元数据服务器节点 MP:获取 SP、BP 节点的数据字典信息。

新一代分布式数据库 DMDPC 满足金融、电网、交通、工业互联网等多场景需求。1)金融 系统:DMDPC 基于改进的多主机 XA 协议、基于分布式环境的多版本并发控制等技术,保 证了分布式数据库对事务 ACID 规范的支持,满足金融核心业务系统对事物强一致性的需求;2)智慧电网:支持同城异地多活,可有效支持电网在全国多地的部署联网;3)智慧交通:DMDPC 可实现计算资源的按需分配,弹性扩展、支持 GIS 地理信息存储;4)工业互联网:支持100以上的分布式节点且采用多种安全加固措施,可支撑工业互联网的数据安全需求。

人大金仓:背靠 CETC 中国电子科技集团,老牌数据库

背靠 CETC 中国电子科技集团,是成立最早的国产数据库企业。人大金仓背靠 CETC 中国 电子科技集团,由中国人民大学最早一批从事数据库研究的专家于 1999 年发起创立,先后 承担了国家“863”、“核高基”等重大专项。人大金仓专注数据库领域 20 余年,具备出色 的数据库产品研发和服务能力,数据库产品广泛服务于电子政务、国防军工、能源、金融、 电信等 60 余个重点行业和关键领域,截至 2021 年,产品累计装机部署超百万套。

三大数据库产品各具优势,使用多类型应用场景。1)KES:KingbaseES 作为人大金仓的 通用型数据库产品,是一款面向大规模并发交易处理的企业级关系型数据库,严格支持 ACID 特性,具备迁移简单、高度容错、系统自治、兼容性好的突出优势,并提供可覆盖迁 移、开发及运维管理全使用周期的智能便捷工具;2)KADB:KingbaseAnalyticsDB 采用 shared-nothing 分布式架构,是一款具有高性能、高扩展性能力的 MPP 数据库产品,适用 于数据仓库、决策支持、高级分析等分析类应用场景;3)KSOne :是人大金仓自主研发 的 HTAP 分布式数据库,拥有高可靠,高安全,弹性伸缩,高效备份恢复等关键能力,可 以为海量数据、海量并发用户、高负载压力、高连续性要求的业务系统提供强有力支撑。

人大金仓致力于为政务、能源、国防、金融、电信等国家企事业单位提供数据解决方案。人大金仓作为国产数据库领军企业,积极推动与产业链上下游伙伴产品的兼容适配,涵盖 芯片、操作系统、云平台、中间件以及上层软件应用,具备来自上下游 1,300 多家公司超 4,000 份兼容认证,全面适配国家专用项目相关产品。人大金仓在部署模式上提供线下部署 与线上云适配两种形式,云联合方案覆盖主流云厂商。金仓数据库产品广泛服务于电子政 务、国防军工、能源、运营商、金融等 60 余个关键行业,涵盖国家电网、南方电网、中国 人民银行、中国银行、中国邮政、中国移动等重点企事业单位。

阿里 OceanBase:金融级分布式关系数据库,核心代码开源

发端于阿里内部,2021 年正式开源。OceanBase 是由蚂蚁金服、阿里巴巴完全自主研发 的分布式关系型数据库,始创于 2010 年,应用于支付宝全部核心业务以及阿里巴巴淘宝业 务,从 2017 年开始,开始服务外部客户。2020 年 6 月 8 日,蚂蚁集团将自研数据库产品 OceanBase 独立进行公司化运作,同年 9 月,中国工商银行开始采用蚂蚁自研数据库 OceanBase,其对公(法人)理财系统已完成从大型主机到 OceanBase 分布式架构的改 造。2021 年 6 月,OceanBase3.0 版本发布并正式开源;2022 年 8 月,OceanBase4.0 正 式发布,成为业内首个单机分布式一体化数据库。

OceanBase 是金融级分布式关系数据库,具备在线水平扩展能力。OceanBase 是一款针 对特殊巨型复杂网络、超大实时更新数据场景的分布式实时数据库产品,拥有简单易用、 性能高的特点。该产品定位是一款分布式关系数据库,适合于金融、证券等涉及交易、支 付和账务等对高可用、强一致要求较高,同时对性能、成本和扩展性有需求的金融属性场 景,以及各种关系型结构化存储的 OLTP 应用。

OceanBase 产品体系涵盖四大类:1)分布式数据库:包括社区版、企业版、公有云三大 版本,社区版可免费下载,适用于中小企业开发者,企业版适用于追求更高扩展能力、稳 定性的中大型企业,公有云版适用于阿里云、AWS 等全球主流公有云场景;2)图数据库:OceanBase TuGraph 构建了包含图存储、图计算、图学习、图研发平台的完善的图技术体 系,适用于金融、工业、政务等业务场景;3)时序数据库:OceanBase CeresDB 基于 OceanBase 分布式存储引擎,用来存储和管理时间序列数据,适用于物联网 IoT、运维监 控等业务场景;4)工具体系:涵盖数据库评估、迁移、开发、运维等工具。

OceanBase 客户主要集中在银行、保险证券、政企、互联网。OceanBase 最早应用于阿 里集团的淘宝、网商银行、支付宝等业务场景,实现了在互联网、金融交易等业务上的产 品沉淀,目前下游客户主要集中在银行、保险、证券、政企、互联网等领域。以中国工商 银行为例,面对工商银行的 5 级容灾要求,OceanBase 结合不同的副本属性组合实现“数 据库同城双活、异地 RPO=0 的两地三中心方案”的容灾部署,实现了两地三中心的城市级 容灾,解决了容灾标准高、建设成本高、备机房资源浪费等问题,满足 7x24 小时服务要求, 数据库服务器资源利用率达到 75%,降低了整体的投入成本。

华为 GaussDB:AI 原生数据库,拥抱开源生态

AI 原生&支持异构计算。华为 GaussDB 是一个企业级 AI-Native 分布式数据库,可为超大 规模数据管理提供高性价比的通用计算平台,也用于支撑各类数据仓库系统、BI 系统和决 策支持系统,为上层应用的决策分析提供服务。GaussDB 采用 MPP(Massive Parallel Processing))架构,支持行存储与列存储,提供 PB 级别数据量的处理能力。GaussDB 是 全球首款 AI-Native 数据库,能够同时支持 X86、ARM、GPU、NPU 等异构计算,布局全 球 7 大区域,服务金融、政企、互联网、游戏、汽车等行业标杆客户超 2,500 家。

GaussDB 包含三大产品线:关系型数据库、非关系数据库、数据库生态工具/中间件。1) 关系型数据库:包括华为自研的云数据库 GaussDB(for openGauss)、GaussDB(for MySQL)以及非自研的适用于 MySQL、PostergreSQL、SQL Server 的云数据库 RDS;2) 非关系型数据库:包括华为自研的 GaussDB(for Mongo)、GaussDB(for Cassandra)、 GaussDB(for Influx)、GaussDB(for Redis)以及非自研的文档数据库服务 DDS;3)数 据库生态工具/中间件:包括数据复制服务 DRS、管理服务 DAS、数据库和应用迁移 UGO 以及分布式数据库中间件 DDM。

openGauss 拥抱开源。2019 年 9 月,华为宣布开源其 GaussDB 数据库,开源后的产品 命名为 openGauss,2020 年 6 月 openGauss 源代码正式开放并发布 1.0.0 版本,同年 7 月社区关键组织开始运行。openGauss 内核源自 PostgreSQL,代码自研占比超过 74%, 截至 2022 年 6 月开源社区用户超 64 万,贡献者约 3,000 人。基于 openGauss 开放生态, 华为进一步推出分布式云数据库 GaussDB(for openGauss),该产品具备企业级复杂事务 混合负载能力,同时支持分布式事务强一致、同城跨 AZ 部署、数据 0 丢失,支持 1000+ 的计算节点扩展能力、4PB 海量存储,拥有云上高可用、高可靠、高安全、弹性伸缩、一 键部署等关键能力,现已广泛适用于金融、政企、互联网等关键场景。

GaussDB 适应互联网、金融、游戏、汽车等多业务场景。GaussDB(for openGauss)作 为金融级分布式数据库,具有高性能、高弹性、AI-Native 自治的典型特性,广泛应用于金 融业务场景;GaussDB(for MySQL)数据库提供百万级 QPS,性能最高可以达到 MySQL 社区版本的 7 倍、GaussDB(for Mongo) 性能最高可以达到 MongoDB 社区版本的 3 倍, 满足游戏业务场景下弹性伸缩、一键回档、快速开服的业务需求;综合应用 RDS 数据库、 DDS 文档型数据库、数据复制服务 DRS、分布式数据库中间件 DDM 等产品,可构建读写 分离的分布式架构,为互联网行业应用提供分布式解决方案。

巨杉数据库:自研金融级分布式数据库的独立厂商

专注分布式数据库技术研发的自研数据库独立厂商。巨杉数据库成立于 2012 年,是一家专 注分布式数据库技术研发的自研国产基础软件厂商,公司自成立以来,专注数据库产品研 发,坚持从零开始打造原生分布式数据库引擎,经过多年积累,现已推出分布式数据库 DB (实时数据湖)、内容管理平台 CM(多模数据湖)、湖仓融合平台 DP(湖仓一体)三大产 品线,广泛应用于金融、政府、能源、电信、交通等领域,企业用户总数超过 1,000 家。

从商用首发时间看,巨杉数据库是国内最早进行商业化布局的分布式数据库。2012 年, SequoiaDB 巨杉数据库作为独立数据库公司开始研发,进行原生分布式架构布局。2013 年 SequoiaDB v1.0 产品化正式商用并进军企业级领域,开始为客户提供产品及技术服务支持。自研内核具有领先性,支持跨结构化、半结构化、非结构化的多模数据处理。巨杉数据库 坚持自主打造原生分布式数据库引擎,专注数据库技术研发,聚焦金融赛道,致力于以金 融行业为核心,打造安全可靠、高性能,适合全行业通用的分布式数据库产品。巨杉分布 式数据库 SequoiaDB 基于巨杉自研的原生分布式内核,研发出引擎级多模及 STP 逻辑时 钟协议分布式数据库技术,能够实现分布式交易与 ACID 的完全兼容,同时架构及功能特性 与传统数据库完全兼容,提供跨引擎事务支持和一致性保障。SequoiaDB 支持多种级别的 容灾部署形态,如同城双中心、同城三中心、两地三中心、三地五中心等,独创四级熔断 容灾安全保护机制,充分保证数据安全,满足核心交易业务的严苛要求。

湖仓一体平台为数据联通提供解决方案。巨杉推出的湖仓融合平台 SequoiaDP 以分布式数 据库 SequoiaDB、内容管理平台 SequoiaCM 为基础,打破了数据湖与数据仓库割裂的体 系,可以为上层应用提供“一数一源”的数据基础设施。湖仓一体架构除了具备多模能力, 兼容多种结构化数据、半结构化数据和非结构化对象数据引擎以外,还可以提供包括流式 计算、高性能列存分析引擎、跨引擎数据 ACID 一致性等能力,支持 Tableau、Power BI、 帆软、SmartBI 等国内外分析工具,解决了独立建设、管理的数据库数据互不相通的问题。

助力数据库信创生态、支撑体系建设。巨杉数据库积极参与信创生态建设,根据 2021 年信 创产业技术与应用大会,截至 2021 年 3 月,巨杉已经与鲲鹏、飞腾、统信、银河麒麟等产 品完成兼容认证,合作伙伴总数超 50 家,为企业客户打开丰富的上下游产品生态。得益于 引擎级多模的高度兼容,巨杉数据库现已与近百家企业的 200+产品完成了兼容测试与认证, 产品对接时间平均降低到 15 个工作日,为企业客户打开丰富的上下游生态。2019 年,巨杉数据库搭建“巨杉大学”认证与学习体系,讲师团队由巨杉数据库官方的数 据库架构师、资深分布式技术专家以及开源社区技术大咖共同组成。截至 2021 年 6 月,已 有超 180 家金融机构,30 余家知名技术服务开发商参加巨杉大学计划。截至 2020 年底, 经过短短 1 年的发展,巨杉大学已认证工程师超过 1 万人,网站用户注册数量超过 5 万人, 为分布式技术业界发展提供坚实的人才积淀。

PingCAP TiDB:开源分布式关系型数据库

TiDB 为 PingCAP 自主研发的一栈式实时 HTAP 数据库。PingCAP 公司成立于 2015 年, 借鉴 Google Spanner 及 F1 论文的实现,TiDB 在 Github 上开源,从仅有 SQL 层及 KV 层 的 beta 版本到现在已经衍生出庞大家族的 6.0 版本,始终围绕着为用户提供一栈式 OLTP、 OLAP、HTAP 解决方案的目标演进。在内核设计上,TiDB 分布式数据库将整体架构拆分 成了多个模块,各模块之间互相通信,组成完整的 TiDB 系统。与传统的单机数据库相比, TiDB 的纯分布式架构拥有良好的扩展性且具有丰富的工具链生态,覆盖数据迁移、同步、 备份等多种场景。2022 年,TiDB Cloud 正式商用,TiDB 支持本地和云部署两种方式。

TiDB 适应多应用场景。依托纯分布式架构及开源社区,TiDB 持续扩展出丰富的应用场景:1)对数据一致性及高可靠、系统高可用、可扩展性、容灾要求较高的金融场景:TiDB 采 用多副本+Multi-Raft 协议的方式将数据调度到不同的机房、机架、机器,当部分机器出现 故障时系统可自动进行切换;2)对存储容量、可扩展性、并发要求较高的海量数据及高并发的 OLTP 场景:TiDB 采用 计算、存储分离的架构,可对计算、存储分别进行扩容和缩容,计算最大支持 512 节点, 每个节点最大支持 1000 并发,集群容量最大支持 PB 级别;3)Real-time HTAP 场景:TiDB 在 4.0 版本中引入列存储引擎 TiFlash,结合行存储引擎 TiKV 构建真正的 HTAP 数据库,在增加少量存储成本的情况下,可以同一个系统中做联机 交易处理、实时数据分析,极大地节省企业的成本;

4)数据汇聚、二次加工处理的场景:TiDB 通过 ETL 工具或者 TiDB 的同步工具将数据同 步到 TiDB,在 TiDB 中直接生成报表,便于将分散在不同系统中的数据汇总,以便决策层 了解公司的整体业务状况及时做出决策。“开源社区”助力“开源商业化”。PingCAP 拥有丰富的开源社区活动,形成开源社区和自 身研发的有效协同。通过开源及免费策略,快速扩展开发者及技术粉丝用户群体,实现未 来商业变现机会的长期积累。据 GitHub,截至 2022 年 8 月,TiDB 项目在 GitHub 上已 总计获得超 32,000 颗星,超 1,800 位开源代码贡献者,高度活跃的开源社区为 TiDB 产 品发展带来了正向反馈闭环。TiDB 已广泛应用于互联网、游戏、金融、政府等多领域。

星环科技:专注企业级大数据服务,布局分布式数据库

布局分布式数据库,搭建数据服务闭环。星环科技成立于 2013 年,专注于企业级容器云计 算、大数据和人工智能核心平台的研发和服务,目前已形成包括大数据与云基础平台(大 数据基础平台 TDH、数据云平台 TDC)、分布式关系型数据库(ArgoDB、KunDB)、数据 开发与智能分析工具(大数据开发工具 TDS、智能分析工具 Sophon)在内的产品体系。ArgoDB 与 KunDB 分别为分析型、交易型数据库产品:1)ArgoDB:是一款具备多模型、 联邦等特性的高性能分析型分布式数据库,于 2019 年成为全球第四个通过 TPC-DS 基准 测试并经过 TPC 官方审计的数据库产品;2)KunDB:是一款兼容 SQL 标准语言的交易 型分布式数据库,可支持高并发交易场景的核心业务。

ArgoDB 满足数据多模、联邦计算需求。与传统的 MPP 数据库相比,ArgoDB 具有存算解 耦结构,存储和计算独立按需扩缩容,具备更强的可扩展性、一致性、平滑适配云原生架 构等优势。2022 年最新发布的 ArgoDB 5.0 推出新一代的向量化计算引擎和多模存储引擎, 分析能力达到了同类数据库产品 2~10 倍,同时可提供多模分析,拥有实时数据处理、AETP 混合负载、联邦计算、隐私计算等能力,可一站式满足湖仓集一体化建设需求。

KunDB 支持高并发交易场景的核心业务。KunDB 具有业内领先的事务处理性能,SQL 兼 容性以及最新的分布式查询优化技术,支持复杂查询且性能是 MySQL 的 10 倍以上,充分 满足高并发、大数据量的交易型业务场景。升级后 KunDB 3.0 高度兼容 Oracle 语法及 PL/SQL,基于升级的 TSO 全新分布式事务架构,性能领先主流开源 NewSQL 5 倍以上, 分布式查询优化和向量化执行引擎技术支持 TPCH 复杂分析,并提供一体化实时 HTAP, 支持一致性备份恢复及容灾,全面助力数据库国产化升级。

星环科技数据库服务能源、金融、政府、交通等多业务场景。ArgoDB 主要用于构建离线数 据仓库、实时数据仓库、数据集市等数据分析系统,适用于构建能源、物联网、政务等大 数据平台的业务场景。KunDB 适用于对数据具有高并发读写需求,同时需要 ACID 保证的 交易型场景,如金融、电信、能源等核心业务系统;也适用于对数据库有高并发和大容量 存储需求的场景,如物联网、日志存储等系统。此外,公司结合 KunDB 和 ArgoDB 打造了 一体化实时 AETP技术(分析增强型交易库),可以同时支撑交易与分析混合型的业务场景。


《数字中国发展报告(2022年)》指出,要培育壮大工业互联网、区块链、人工智能等数字产业,打造具有国际竞争力的数字产业集群。同时,支持数字企业发展壮大,推动平台企业规范健康发展。国产数据库作为国产化替代的重要环节,在我国信创产业政策的指引下实现加速发展。随着国产化替代的加速,各个细分市场的国产化厂商进一步“攻城略地”,不断提升市场份额,在此背景下,国产数据库市场有望再度突破期。

最后修改时间:2023-05-25 12:41:42
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论