
海量数据,成立于2007年,是国内最早上市的数据库厂商。其公司发展经历了几个阶段,从早期的以数据库服务为主营业务的企业,逐步发展为走纯国产道路、坚持自主研发的以数据库产品为核心业务的上市公司。公司形成了是以 Vastbase 数据库为核心的产品系列。近些年来,海量数据高速发展已跻身国内数据库企业前列。针对与会者对经营理念、研发路线、产品定位等问题,海量数据进行了详细的说明。
1).海量数据为何逆势扩张?
作为一家上市公司,海量数据的很多经营数据都是公开披露的,从这些信息中可见,海量数据在连年亏损的情况下,仍然保持对技术研发做了大量投入;特别是近两年来整体大环境较差情况下,海量数据一直在进行人员扩充。针对这点,海量数据表示,国产数据库研发之路是很艰难的,要想真正做好一款产品是需要大量资金、技术及人力的投入。海量数据聚焦于国产数据库研发,将产品能力视为公司长远发展的基础,因此在逆势情况下仍然保持足够投入。当然,这种扩张不是盲目的,是随着公司、产品发展阶段不断调整。
2).为何选择 openGauss 技术路线?
在海量数据发展之初,是存在多种技术路线之争的,从早期的 MySQL、PG路线之选,选择了 PG 作为技术路线,到后续选择了 openGauss 路线,这其中是经过了公司反复论证。相较于其他开源数据库产品,openGauss 是国人缔造的一款开源数据库,由学术界、产业界及用户共同打造开源社区并共享成果。其起源来自华为在数据库领域的多年研发实践,并在社区共治下快速发展。海量数据作为 openGauss 路线的参与者和贡献者,非常看好 openGauss 旺盛的生命力,相信在未来能取得更大的成果。作为众多 openGauss 分发厂商,海量数据目前仍是openGauss路线唯一通过国家安全可靠测评的厂商。
3).为何重点投入集中式架构?
与众多国产数据库采用分布式路线不同,海量数据仍然坚持集中式产品路线,这听起来似乎有点“落后”。海量数据表示,分布式与集中式数据库各自有其适应场景,集中式数据库经过多年发展相对成熟,可覆盖客户大部分场景。公司秉承了“聚焦战略、打造精品”的理念,将大部分资源投入到集中式数据库这一单品,这样有利于做大做强。
曾几何时,国内数据库企业如雨后春笋般涌现出来,行业厂商快速扩展;但随着如信创目录、国测等一系列指导性措施落地,行业企业还是两极分化。整个行业加速洗牌,呈现快速收敛态势。在如此竞争环境之下,什么样的企业才能生存下来呢?海量数据谈了他们对行业的理解。

1).生存要素之资金
作为第一位要素的无疑是资金。企业是否能保持良好的现金流,是是否能生存下来的关键。行业头部企业往往是有国字头背景、大厂靠山等;中小企业要想能生存下去,要么有较为通畅的融资渠道,要么有在细分市场上取得成绩,形成商业闭环。后者会非常考验企业的销售能力。此外,企业什么时候扩展、什么时候收缩,该在哪个方向投入,这也考验企业的经营能力。
2).生存要素之技术
作为一款基础软件,数据库产品从核心能力上来看,还是要看技术。这其中包括企业是否具备关键核心技术人员,是否能做到持续创新甚至引领,产品从技术角度是否具备竞争力及更为关键的好的设计还需好的工程化能力。这也就可以理解为什么数据库厂商在技术投入上往往是最多的。这里特说明下关于开源的问题,很多国产数据库产品是基于开源构建而来,是否具备对开源的技术把控能力就成为关键。这里并不排斥使用开源,站在巨人肩膀上发展无疑是捷径,但重要的是把控。
3).生存要素之效率
如果说资金和技术是数据库企业能否走的起来的关键,那么效率就是企业能否走的长远的关键。企业的经营决策效率及人才的引入与激励,会觉得企业是否能保持持续的战斗力,在残酷的市场竞争中能站稳脚跟并持续发展。这一点海量数据给我一点突出印象就是其精细化的管理能力,甚至可做到全员数字化看板,可细化到每个人的投入与产出。这也是其能保持长久发展的根本。
4).生存要素之政策
某种意义上讲,国内的数据库市场是一种“政策”类型的市场,如何利用好当前政策,是企业能否趁着风口发展的关键。随着国家、地方、行业的各种政策纷纷出台,数据库企业要学会理解政策、利用政策甚至参与政策之中。比较常见的如各类资质的问题,就是企业能否上牌桌的“生死符”,要做好一定的资质布局,有所为有所不为,集中企业资源投入关键领域。
5).生存要素之市场
数据库是生态产品,有客户才有生态。客户成为推动企业构建、融入生态的最大驱动力,也是企业成功的重要标志,没有生态的产品是没有发展的。企业如何通过品牌建设,梳理知名度;构建自有生态圈,促进市场活跃;最终助力销售转化并保持良好供给。
海量数据,经过多年发展形成以 Vastbase 集中式数据库及生态工具为核心,上下覆盖有 Vastcube数据库一体机系列、Vastorage 闪存与分布式存储及 Datalink 大数据平台。

其中 Vastbase 为重中之重。本次交流上我提出一个问题就是“可以给 Vastbase 产品打上什么样的标签”,海量数据同事给我的回答是三个标签:自主可控、应用满足度高、集中式数据库。
自主可控,是指 Vastbase 是基于 openGauss 这一国人自主的开源项目为核心,可真正做到自主可控。
应用满足高,是指产品具备高性能、高兼容性、良好的生态适配和完善的用户使用体验。
集中式,则是说明其部署模式是集中式产品。
此次发布会的重点,是其产品特性的升级,升级方面亮点可以用一体化和智能化两个词的说明。详细展开就是海量数据库 Vastbase 的全新特性,一是集成AI融合方向的向量数据处理引擎,一是增强在多模多态场景下的数据处理能力。此外还辅助一些在内核方面的增强。

1).亮点:一体化
在一体化方面,Vastbase增强了时序引擎,实现超10:1压缩比,每秒超过500万个数据采集点;增强了空间引擎,提供空间数据的快速查询和分析;增强了轻量化部署能力,实现云边端高效协同。
时序引擎
物联网时代,时序数据应用越发广泛,时序数据的处理能力尤为关键。Vastbase 在关系库的基础上融合了时序引擎vTime,采用创新的“无损数据压缩算法”,Vastbase实现了超过10:1的压缩比,极大提升了数据存储效率;在数据采集时,Vastbase的单节点处理能力,也达到每秒超过500万个数据采集点,实现了对时序数据处理的极致性能。
空间引擎
通过融合空间数据处理引擎,Vastbase实现了对空间数据对象的高效存储和复杂管理,同时借助高性能空间索引技术,确保在大规模空间数据集上能够进行快速查询和分析,为智慧城市建设、自然资源管理等领域,提供了坚实的数据基础和技术支持。
轻量化部署
Vastbase 能够灵活适应、从“嵌入式系统”、“移动应用“到”边缘计算“、”终端部署"等多种场景,与服务器版数据库形成、互补的组合应用。此次发布会海量数据还推出了 Vastbase 轻量化版本,面向资源受限及边缘应用场景,优化云边协同与多模态能力。以工业制造行业为例,在生产线监控、质量检测及智能仓储等、关键场景中,通过灵活运用、不同部署方式的Vastbase,可以实现云、边、端的数据分层处理、以及数据库的互联互通,既确保了数据处理的实时性,又显著提升了数据处理的效率、与深度。
2).亮点:智能化
在智能化方面,Vastbase 在关系型数据库内核的基础上,扩展了向量数据处理引擎。既保有了关系数据库核心的功能,比如事物处理、数据一致性、SQL语法等能力。同时结合了对向量数据的高效计算和分析处理。让用户在常规业务中,也可集成AI技术,实现系统的智能化升级。此外,为确保Vastbase面对海量、复杂数据分析,仍能有良好的性能表现,我们采用了端到端的索引优化策略,通过多种高效压缩算法和GPU加速等技术和手段,实现了低延迟、高吞吐量的卓越性能,为用户提供了一个、强大、高效、可靠的数据处理平台。
3).其他:内核增强与配套工具
作为基础能力,Vastbase 内核在不断优化增强中。此次的更新中有如下亮点:
一是在性能上,通过实施、对执行器和优化器的高级优化策略,显著提升了 SQL引擎的数据处理效能,在双路鲲鹏硬件架构中、实现了10%的性能提升。
二是在兼容性上,在支持多种数据库兼容模式的基础上,针对SQL重写规则、执行逻辑和存储策略等迁移过程中的关键挑战,实现了深层次兼容性优化,实现了近乎零修改迁移。
三是在配套工具上,带来了全新的数据库安装工具DBInstaller,DBInstaller与VEM、VDS、exBase、vCloud、形成新的工具体系组合搭配,可以实现一键部署、实时监控、版本升级、自动化运维等功能,为用户提供一个、全面覆盖各种应用场景的、一站式数据库解决方案。




