据西南证券研究发展中心预测,2025年向量数据库渗透率约为30%,则全球向量数据库市场规模约为99.5亿美元,中国向量数据库市场规模约为82.56亿元。
《2023中国开源开发者报告》由开源中国于2023年12月28日正式发布。报告中,《2023 LLM技术报告》部分引人关注,它详细阐述了向量数据库在 LLM中的应用及其重要性。向量数据库作为一种专门用于存储和检索向量数据的数据库,能够为 LLM 提供高效的存储和检索能力,通过数据向量化,实现了在向量数据库中进行高效的相似性计算和查询。
报告中将向量数据库分为两类:原生向量数据库和添加“向量支持”的传统数据库。原生向量数据库是专门为存储和检索向量数据而设计的,其管理的数据是基于对象或数据点的向量表示进行组织和索引。诸如 Chroma、LanceDB、Margo、Milvus、Pinecone 等都属于原生向量数据库。而添加“向量支持”的传统数据库则是在原有基础上对向量检索进行支持的,如 Redis、PostgreSQL、ClickHouse、Elasticsearch 等。

自2022年ChatGPT问世以来,大模型星火初始,向量数据库引起了技术领域的高度关注,并逐渐在市场和资本层面崭露头角。近两年来,向量数据库公司迎来了一波融资潮。其中,Pinecone、Zilliz、Weaviate、Vespa、Chroma、Qdrant、Margo、LanceDB 等公司均已获得不同程度的融资。
- Pinecone: 已融资 1.38 亿美元
- Zilliz: 已融资 1.15 亿美元
- Weaviate: 已融资 6770 万美元
- Vespa: 已融资 3100 万美元
- Chroma: 已融资 2000 万美元
- Qdrant: 已融资 980 万美元
- Margo: 已融资 440 万美元
- LanceDB: 已融资 50 万美元

(图源:www.cbinsights.com)
值得一提的是,2023年前四个月,向量数据库公司的融资总额已超过了2022年的总和。这一数据来自市场研究公司CB Insights,它表明了向量数据库在资本市场的热度。
据西南证券研究发展中心预测,到2025年,向量数据库的渗透率将达到约30%。据此,全球向量数据库市场规模预计将达到99.5亿美元,而我国向量数据库市场规模则约为82.56亿元。这一预测揭示了向量数据库在我国市场的发展潜力和前景。
总之,向量数据库作为新兴技术领域的重要方向,已经在存储、检索、相似性计算等方面展现出了强大的能力。在 ChatGPT 等大模型的推动下,向量数据库不仅在技术层面备受关注,同时也成为了资本市场的新宠。预计在未来几年,向量数据库将继续保持高速发展态势,为我国人工智能产业的发展提供有力支持。




