
近日,在中国信通院组织的2025上半年“可信数据库”批次测试中,北京火山引擎科技有限公司ByteHouse分析型数据库系统顺利通过向量数据库产品基础能力测试。
测试过程依据《向量数据库技术要求》(T/CCSA 573-2024)标准在基本功能、运维管理、安全性、兼容性、扩展性、高可用以及工具生态七大能力域的相关要求。测试结果表明,该产品在向量数据库的功能完备性、易用性、通用性等方面均符合标准要求。
《向量数据库技术要求》(T/CCSA 573-2024)是中国信通院云计算与大数据研究所依托中国通信标准化协会大数据与区块链工作组(CCSA TC1 WG6)以及大数据技术标准推进委员会(CCSA TC601),联合超过50家企业专家参与编制的技术标准。
其包含基本功能、运维管理、安全性、兼容性、扩展性、高可用以及工具生态七大能力域共47个测试项,其中分为27个必选项和20个可选项。作为业内首个向量数据库技术标准,可为向量数据库的研发、测试以及选型提供参考。

火山引擎ByteHouse分析型数据库
产品简介
随着大型语言模型(LLM)技术不断发展,向量检索与向量数据库持续成为业界关注重点,尤其是在处理如文本、图像、音视频等海量多模态数据的向量检索应用场景中。
处理此类数据时,⼀般先以向量形式进行特征提取,随后进行存储、计算与应用。为解决海量数据场景下向量存储与计算的难题,火山引擎旗下云原生数据仓库ByteHouse推出⾼性能向量检索能力。
目前,该能力已在游戏、汽车、⾦融等多个⾏业落地应用,应用场景包括文本搜索、产品推荐、语义搜索、图像搜索、视频推荐、异常检测、欺诈检测、人脸识别等。
云原生数据仓库ByteHouse是⼀款具备高性能、高可用、低延迟特点的分布式向量数据库,可提供海量多维向量/张量数据、结构化数据以及全文数据的存储、融合检索与分析服务。
旨在为大模型和RAG/Agent系统提供数据支撑,能有效解决纯向量召回不准确、无法满足多样化查询等问题,同时简化系统运维,提高查询精准度。
云原生数据仓库ByteHouse产品由存储引擎、查询引擎、接口和控制面四部分组成,能全面兼容X86、 ARM架构以及主流国产操作系统。

产品核心特性
云原生数据仓库ByteHouse以实现高性能、高资源利用率、高稳定性以及低运维成本为⽬标,其产品特性和优势如下:
1. 多模数据类型支持:提供向量处理与传统数据库功能,能够实现向量、张量、非结构化等多种数据类型的存储与检索,既具备向量处理能力,又保留传统数据库特性,满足多元化数据需求。
2. 高性能向量检索:具备支持千亿级向量规模、万级QPS以及毫秒级查询延迟的能力。
3. 存储计算分离:攻克全局元数据管理、过多小文件存储性能差等技术难题。在最小化性能损耗的前提下,达成存储层与计算层的分离,并实现独立扩缩容。
4. 自研优化器:自主研发的Cost-BasedOptimizer,对多表JOIN等复杂查询性能进行优化,实现性能若干倍提升。
云原生数据仓库ByteHouse
具备全场景引擎能力
不仅限于向量检索
目前,云原生数据仓库ByteHouse依托向量引擎,成功实现了对多种向量检索算法的支持,同时构建起高效执行链路,可有效应对大规模向量检索场景,达成毫秒级的查询延迟。
在“⼀元化数据、多元化引擎”理念指引下,云原生数据仓库ByteHouse全力推进全场景引擎覆盖,旨在达成整体数据效能的最⼤化产出。
除具备支持向量检索能力外,云原生数据仓库ByteHouse还拥有包含全文检索引擎、GIS引擎等在内的全场景引擎,可为用户提供⼀体化数据分析服务。
早在2022年2月,具备高性能与极致分析能力的云原生数仓产品ByteHouse,在字节跳动的部署规模就已突破1万8000台,单集群超2400台。
未来,它将继续为企业数据分析能力提供支持,助力企业数智化转型升级。





