暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

为什么向量数据要归一化?

原创 digoal 2022-01-20
1436

作者

digoal

日期

2021-07-23

标签

PostgreSQL , 向量


原文: 向量搜索的简明数学基础

https://zhuanlan.zhihu.com/p/88117781

1、什么是向量?
浮点数组. 通常用来表述对象特征值, 例如图片、个人属性, 每个向量维度代表一个方向的特征值.

2、向量用来干什么?
通常根据向量值的相似性(向量距离)来搜索相似数据. 例如图片、视频、化学分子式、音频、DNA、文本、指纹、用户决策等.

3、相似算法有哪些?
内积、余弦、欧式

4、什么是向量归一化?
归一化后,向量模长等于1.

5、为什么要向量归一化?
为了让在同等搜索空间的条件下向量相似算法得到一致的结果.

6、向量数据库相关项目
https://www.postgresql.org/docs/devel/cube.html

https://github.com/postgrespro/imgsmlr

https://github.com/eulerto/pg_similarity

https://milvus.io/

https://dl.acm.org/doi/pdf/10.1145/3318464.3386131

PostgreSQL 许愿链接

您的愿望将传达给PG kernel hacker、数据库厂商等, 帮助提高数据库产品质量和功能, 说不定下一个PG版本就有您提出的功能点. 针对非常好的提议,奖励限量版PG文化衫、纪念品、贴纸、PG热门书籍等,奖品丰富,快来许愿。开不开森.

9.9元购买3个月阿里云RDS PostgreSQL实例

PostgreSQL 解决方案集合

德哥 / digoal's github - 公益是一辈子的事.

digoal's wechat

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论