目录
产品简介
Embeddinghub 是一款面向机器学习嵌入领域的向量数据库,它提供了开箱即用的近似最邻近运算、表分区、版本及访问控制等功能。
是否开源:开源
工作流程
嵌入是现实世界对象和关系的密集数字表示,以向量表示。它们通常是通过首先定义监督机器学习问题(称为“代理问题”)来创建的。嵌入旨在捕获它们所源自的输入的语义,随后进行共享和重用,以改进跨机器学习模型的学习。Embeddinghub 可让您以简化、直观的方式实现这一目标。

-
持久存储和精确管理
高可用性存储,可完全控制版本控制、访问和无痛回滚功能。 -
强大的嵌入操作
启用分区、子索引、平均等功能。 -
最近邻近似
使用计算效率高的 HNSW 算法实现高相似度推荐。
产品架构
Embeddinghub 的 Alpha 版本专门用于单节点配置。它使用 RocksDB 持久存储嵌入和元数据,利用 HNSWLib 构建近似最近邻索引。相关的Python客户端还能够使用HNSWLib来构建本地嵌入,但目前不处理持久存储。Embeddinghub 的服务器通过 gRPC 进行通信,并可在此处访问原型服务文件。所有元数据也以序列化的 protobuf 形式存储,如此处定义。
应用场景
自然语言处理
推荐系统
计算机视觉
所属公司
featureform
相关资料
Embeddinghub官网:https://www.featureform.com/embeddinghub
用户评价
0
0
词条统计
创建者:小小亮
编辑次数:0
浏览次数:215
API调用次数:0
贡献者




