暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

柏睿智算一体机内置向量数据库,助力构建AI大模型时代的向量计算引擎

柏睿数据 2023-11-16
398
引言


日前,柏睿数据与华鲲振宇、鲲鹏联创共同打造的智算一体机重磅发布。该一体机RapidsDB数据库、Rapids VectorDB向量数据库为核心,融合了多方核心软硬件产品,集计算、存储、网络、数据库、监控于一体,支持智算多模态混合负载型业务,具有高性能、高可靠性、高性价比、灵活扩展等特点,可满足客户极速增长的智算系统规模和不断变化的AI业务需求。

其中的向量数据库,随着人工智能大模型的火热受到越来越多的关注。本期将重点介绍柏睿数据Rapids VectorDB实现高性能向量计算的创新实践。



进入21世纪,随着移动互联网和大数据的兴起,向量数据库开始得到关注,主要是为了解决高维度数据的存储和查询问题,支持向量之间的相似度计算、向量索引和快速检索等基本功能。


近年来,随着人工智能和机器学习的发展,对向量计算的要求也在不断提高。正如当下火热的AI大模型等AI应用,要求向量数据库在处理大规模高维度向量数据时能够支持复杂相似度计算等功能,以及低时延、高并发、高可扩展等性能。


在处理文字、语音和图像等高维度数据时,如何快速而准确地进行检索查询是关键问题。高维度数据因其数据复杂度、维度灾难等特性,使得如欧氏距离或余弦相似度等传统的相似性度量方法,在高维空间中的高效精确计算变得不切实际。因此,向量数据库需要综合运用更高级的技术、更高效算法、更多的计算资源等来解决这一问题。



柏睿智算一体机内置的向量数据库Rapids VectorDB在柏睿分布式全内存数据库RapidsDB的基础上,开发独立向量计算模块,基于分布式架构,支持本地计算和HNSW向量相似度算法,可实现大规模向量数据查询分析秒级响应




本地计算


Rapids VectorDB是一个分布式向量数据库,其向量计算模块部署在每个leaf节点,这为Rapids VectorDB进行本地计算提供可能。


通过成熟的SQL数据库技术,Rapids VectorDB将向量数据均匀分散到每个计算节点,并在本地执行向量计算。这种方式实现了离数据最近的位置进行计算,从而使得对向量数据的检索查询更加实时高效。



先进算法


Rapids VectorDB使用HNSW(Hierarchical Navigable Small World)向量相似度算法,提供高效、精准的向量计算


HNSW是一种用于近似最近邻搜索的先进算法,因其在高维空间中高效的相似性搜索而被熟知。它采用多层级的数据结构即概率跳跃列表,提高了在大规模向量数据中进行相似性搜索的效率;通过构建可导航小世界图,在保持高准确性的同时,大幅降低了搜索的时间复杂度,从而实现了更快速、更精确、更实时的查询响应能力。


同时,内置Rapids VectorDB的“智算一体机”不仅可大规模高维度向量数据的处理提供强大的数据智能算力,并支持包括向量数据在内的海量多模态数据高效管理与实时分析,全面满足行业AI大模型等人工智能应用、云计算、边缘计算、高性能计算等多样化算力应用需求。


推荐阅读

柏睿数据与华鲲振宇、鲲鹏联创共同打造智算一体机,加速构建数据智能算力基座

柏睿向量数据库基于RapidsDB实现安全高效的向量存储

柏睿数据智算一体机内置数据库获鲲鹏Validated认证

你的  在看  为智能数据算力点赞


文章转载自柏睿数据,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论