暂无图片
暂无图片
7
暂无图片
暂无图片
暂无图片

用 AI 给向量检索加 buff,Milvus 亮相数据库顶会 VLDB

ZILLIZ 2021-08-28
349
2021,数据库领域的研究有哪些突破? 

本月举行的全球数据库顶会 VLDB 上,Zilliz 与哈佛大学、卡内基梅隆大学、清华大学、微软等多家高校与企业受邀介绍最新研究进展,分享了将机器学习方法应用到数据库系统的经验。Zilliz 高级研究员易小萌介绍了开源向量数据库 Milvus 的开发背景、设计思路,以及开发过程中遇到的挑战与技术创新点。

VLDB 与 SIGMOD 和 ICDE 是数据库领域久负盛名的三大顶会。此前,由 Zilliz 研发团队贡献的研究成果 Milvus: A Purpose Built Vector Data Management System 因其底层功能过硬、业务场景完善,而被 SIGMOD 评委会相中,收录为今年 21 篇工业界论文之一。
人们每时每刻都在生产大量的图像、音频、视频数据,其中超过 80%的数据都是处理难度较大的非结构化数据,而传统的数据库只能存放有限的、经过提取和加工后的数据。对此,Milvus 团队的工程师们设想了一种可能:尽管数据具有不同的类型,在语义(Semantics)层面上可以用向量对数据进行统一的表示。易小萌谈到,如果使用 AI 神经网络模型提取数据类型的语义,将其以向量的形式统一呈现,许多数据的处理逻辑可以直接在向量上执行。
Milvus 专为分析和检索海量特征向量而设计,提供完整的向量数据更新、索引与查询框架,在满足动态数据实时搜索的同时,也能满足实际业务中多样化的查询需求。目前,Milvus 已经发布 1.0 单机版与 2.0 分布式版两个版本,所有代码完全开源,已被广泛应用于人工智能前沿领域,经过了全球 1000 家用户的实践验证,性能大幅超越同类向量检索系统。
在分享中,易小萌介绍了 Milvus 2.0 云原生优先、日志即数据、批流一体的设计理念,在初代的基础上,Milvus 2.0 为用户提供智能、稳定、流畅的查询体验。
面对数据库构建中索引的选择和数据调优两大挑战,易小萌相信 AI 能够提供可能的解决方案。例如,先在小数据集上进行评估新配置,再将结果转移到大数据集,让机器学习已有的数据集,用它来指导新数据集进行配置,从而达到比目前的 BOHB 算法更优的解法。

想知道更多干货内容?戳 OSCHINA 网站上的干货分享版!

https://my.oschina.net/u/4209276/blog/5207483(长按复制链接到浏览器)

  易小萌  
Zilliz 研究员、研究团队负责人、华中科技大计算机系统结构博士。
主要工作领域为向量近似搜索算法和分布式系统的资源调度,相关研究成果在 IEEE Network Magazine、IEEE/ACM TON、ACM SIGMOD、IEEE ICDCS、ACM TOMPECS 等计算机领域国际顶级会议与期刊上发表。

📖  Milvus docs

Milvus 文档链接奉上:https://milvus.io/cn/docs/home

🚀 Milvus Roadmap  

关于 Milvus 的未来的更多规划,欢迎大家通过 Roadmap 项目来了解:https://milvus.io/docs/v2.0.0/roadmap.md

🙏Thank you contributors!

最后感谢 Milvus 社区的 147 位贡献者 ❤️  有了他们才有了今日的 Milvus 2.0。也欢迎大家开 issue 吐槽,或是加入社区一起贡献:https://milvus.io/community
Github @Milvus-io|CSDN @Zilliz Planet|Bilibili @Zilliz-Planet
Zilliz 以重新定义数据科学为愿景,致力于打造一家全球领先的开源技术创新公司,并通过开源和云原生解决方案为企业解锁非结构化数据的隐藏价值。 
Zilliz 构建了 Milvus 向量数据库,以加快下一代数据平台的发展。Milvus 目前是 LF AI & Data 基金会的毕业项目,能够管理大量非结构化数据集。我们的技术在新药发现、计算机视觉、推荐引擎、聊天机器人等方面具有广泛的应用。
最后修改时间:2021-08-30 12:20:10
文章转载自ZILLIZ,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论