暂无图片
暂无图片
暂无图片
暂无图片
暂无图片
CN119293035A-向量数据库的数据处理方法、设备、介质及产品_电科金仓.PDF
13
19页
0次
2025-02-10
免费下载
(19)国家知识产权局
(12)发明专利申请
(10)申请公布号
(43)申请公布日
(21)申请号 202411320610 .X
(22)申请日 2024 .09 .20
(71)申请人 中电科金仓北京科技股份有限公
地址 100102 北京市朝阳区容达路7号院5
号楼13101内二层201
(72)发明人 韦丹妮 王建华 
(74)专利代理机构 北京智汇东方知识产权代理
事务所(普通合伙) 11391
专利代理师 孙岩
(51)Int.Cl .
G06F
16/22
(2019 .01)
G06F
16/2458
(2019 .01)
G06F
18/23213
(2023 .01)
(54)发明名称
向量数据库的数据处理方法设备介质及
产品
(57)摘要
本发明提供了一种向量数据库的数据处理
方法设备介质及产品向量数据库的数据处理
方法包括从向量数据库的所有向量数据中选择
预设数量的向量数据作为聚类中心获取每个待
分类向量数据与所有聚类中心的距离待分类向
量数据为所有向量数据中未作为聚类中心的向
量数据根据每个待分类向量数据与所有聚类中
心的距离将待分类向量数据记入包括与其距离
最近的聚类中心对应的类群在内的至少一个类
当待查询向量位于距离最近的聚类中心对应
的类群的边缘时即使只从距离最近的聚类中心
对应的类群中查找与待查询向量最为相似的几
个向量数据也能够获取到按照现有技术分类本
应只属于其他类群边缘的与其较为相似的向量
数据
权利要求书2页 说明书10页 附图6页
CN 119293035 A
2025.01.10
CN 119293035 A
1 .一种向量数据库的数据处理方法包括
从所述向量数据库的所有向量数据中选择预设数量的向量数据作为聚类中心
获取每个待分类向量数据与所有聚类中心的距离所述待分类向量数据为所有向量数
据中未作为聚类中心的向量数据;
根据每个所述待分类向量数据与所有聚类中心的距离将所述待分类向量数据记入包
括与其距离最近的聚类中心对应的类群在内的至少一个类群
2 .根据权利要求1所述的向量数据库的数据处理方法其中
所述根据每个所述待分类向量数据与所有聚类中心的距离将所述待分类向量数据记
入包括与其距离最近的聚类中心对应的类群在内的至少一个类群的步骤包括
将所述待分类向量数据记入与其距离小于等于参照距离的所有聚类中心对应的类群
中,所述参照距离为所述待分类向量数据与最近的聚类中心之间的距离乘以预设修正值后
得到所述预设修正值大于1小于等于1.5。
3 .根据权利要求2所述的向量数据库的数据处理方法其中
所述预设修正值大于等于1 .15小于等于1 .25
4 .根据权利要求2所述的向量数据库的数据处理方法其中
所述将所述待分类向量数据记入与其距离小于等于参照距离的所有聚类中心对应的
类群中的步骤包括
对所述待分类向量数据与所有聚类中心的距离按照大小进行排序
将所述待分类向量数据记入与其距离最近的聚类中心对应的类群中
按照由小到大依次判断待判定聚类中心与所述待分类向量数据的距离是否小于等于
所述参照距离若是将所述待分类向量数据记入所述待判定聚类中心对应的类群中
否,判定完成所述待分类向量数据的分类
其中所述待判定聚类中心为除与所述待分类向量数据距离最近的聚类中心之外的其
余聚类中心
5 .根据权利要求1所述的向量数据库的数据处理方法其中
所述根据每个所述待分类向量数据与所有聚类中心的距离将所述待分类向量数据记
入包括与其距离最近的聚类中心对应的类群在内的至少一个类群的步骤之后包括
对每个类群中所有向量数据取平均值作为新的聚类中心
重复执行所述获取每个待分类向量数据与所有聚类中心的距离的步骤至所述对每个
类群中所有向量数据取平均值作为新的聚类中心的步骤直至每个类群的聚类中心均不再
变化
6 .根据权利要求1所述的向量数据库的数据处理方法其中
所述从所述向量数据库的所有向量数据中选择预设数量的向量数据作为聚类中心的
步骤包括
从所述向量数据库的所有向量数据中随机选择一个向量数据作为聚类中心
获取未作为聚类中心的向量数据与已有聚类中心的最短距离
将与已有聚类中心的最短距离最大的向量数据确定为下一个聚类中心
重复执行所述获取未作为聚类中心的向量数据与已有聚类中心的最短距离和将与已
有聚类中心的最短距离最大的向量数据确定为下一个聚类中心的步骤直至聚类中心的数
权 利 要 求 书
1/2
2
CN 119293035 A
2
of 19
免费下载
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文档的来源(墨天轮),文档链接,文档作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论

关注
最新上传
暂无内容,敬请期待...
下载排行榜
Top250 周榜 月榜