暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

超强组合!Dify+Milvus构建生产级RAG系统的终极指南

原创 阿里云大数据AI技术 2025-07-31
517

原理介绍

大语言模型常因知识局限而产生“幻觉”。检索增强生成(RAG)技术通过连接外部知识库,有效解决了这一痛点。要实现高效的RAG,一个强大的向量数据库至关重要。本文将聚焦于业界领先的Milvus,并借助低代码AI平台Dify,向您展示如何将二者无缝结合,快速搭建一个企业级的RAG应用,直观感受向量数据库在解决AI“最后一公里”问题上的核心价值。

阿里云Milvus基本原理介绍

基本原理与架构概述

Milvus 是专为向量相似性搜索设计的分布式数据库,其核心基于以下关键技术:

  • 近似最近邻搜索(ANN):通过HNSW、IVF、PQ等算法实现高效向量检索,平衡精度与速度。

  • 向量索引与查询分离:支持动态构建多种索引类型(如FLAT、IVF_FLAT、IVF_PQ、HNSW),适配不同场景需求。

  • 向量数据分片与分布式计算:数据水平切分(Sharding)并行处理,实现高吞吐与低延迟。

采用云原生和存算分离的微服务架构。该架构分为接入、协调、执行和存储四层。各组件可独立扩展,确保了系统的高性能、高可用性和弹性。它依赖成熟的第三方组件(如etcd、对象存储)进行数据和元数据管理,稳定可靠。

阿里云Milvus系统架构图

使用场景

阿里云 Milvus 适用于任何需要进行“相似性”匹配的场景。其核心应用包括:

  • 图像视频搜索:如电商平台的以图搜图、安防领域的人脸识别和视频轨迹追踪。

  • 文本语义搜索:构建智能客服、企业内部文档知识库和代码搜索引擎,能精准理解用户意图,而非简单的关键词匹配。

  • 个性化推荐系统:根据用户的行为和偏好向量,实时推荐最相似的商品、音乐、新闻或视频。

  • 前沿科学与安全:在生物信息学中加速药物分子筛选,或在网络安全领域进行异常流量和欺诈行为检测。

  • 智能驾驶数据准备与挖掘:对点云图像、车载传感器收集的音视频等多模态数据进行向量数据的实时查询。

Dify 平台介绍

Dify 是开源人工智能应用开发平台,具有低代码的工作流和友好的用户界面的特点,其核心使命是通过将“后端即服务”(Backend-as-a-Service)与“大语言模型运维”(LLMOps)的理念深度融合,来彻底简化和加速AI应用的构建全过程。

作为一个全栈式的解决方案,Dify 在后端层面,提供了稳定可靠的API服务、数据管理等基础设施,让开发者无需从零搭建;在 LLM 运维层面,提供了一个直观的可视化提示词编排界面,让复杂的提示工程变得简单高效。其内置的高质量检索增强生成(RAG)引擎,能够轻松连接企业文档、数据库等私有知识库,让大模型基于特定领域的知识进行回答,有效减少了信息幻觉,并确保答案的准确性和可追溯性。

操作步骤

前提条件

1、Dify 安装与配置

安装 Dify

请通过Git命令将开源Dify项目从GitHub克隆至本地。

git clone https://github.com/langgenius/dify.git

进入目录备份.env配置文件

cd dify
cd docker
cp .env.example .env

修改配置文件.env

VECTOR_STORE=milvus
MILVUS_URI=http://YOUR_ALIYUN_MILVUS_ENDPOINT:19530
MILVUS_USER=YOUR_ALIYUN_MILVUS_USER
MILVUS_PASSWORD=YOUR_ALIYUN_MILVUS_PASSWORD

注意

  • 将YOUR_ALIYUN_MILVUS_ENDPOINT替换为您的阿里云Milvus公网地址。

  • 将YOUR_ALIYUN_MILVUS_USER替换为您的阿里云Milvus用户。

  • 将YOUR_ALIYUN_MILVUS_PASSWORD替换为您的阿里云Milvus密码。

启动Dify

docker compose up -d

安装成功验证

启动后访问部署的Dify服务IP地址http://127.0.0.1/ 进入Dify的登陆页面,设置管理员账号密码,并登陆进管控台。

2、设置默认模型

登录成功后,单击右上角头像,下拉菜单中选择设置。

在设置–模型提供商处安装模型供应商,在这里我们选用了通义千问的模型,可以在百炼平台获取API-KEY。安装后,将API-KEY输入,验证绿灯即可。

弹出的设置菜单中,选择左侧模型供应商,下拉选择通义千问,单击安装按钮安装模型。

模型安装成功后,选择设置API-KEY,将提前准备好的百炼平台API-KEY 输入。

系统模型设置可以参照以下设置。

验证绿灯即可。

3、准备数据集创建知识库

接下来准备测试数据来创建知识库。

单击上方知识库按钮,点击创建知识库。

数据源选择导入已有文本,您可以点此下载示例数据阿里云Milvus简介

数据源参考如下配置,单击保存并处理。

可以看到数据库已经成功创建,并且索引创建完毕

4、验证向量检索是否成功

通过docker logs 查看,可以看到dify日志里显示上传成功

登录阿里云Milvus控制台,选择您配置的Milvus实例,单击右上角Attu Manager进入Attu页面,可以看到对应的collection数据已导入。详情请参见Attu工具管理

5、验证RAG效果

单击上方工作室回到首页,选择从应用模板中创建。

左侧菜单中选择Knowledge Retrieval,使用knowledge Retreival + Chatbot模板。

创建模板。

选择Knowledge Retrieval节点,知识库设置为上面步骤中创建的知识库。

选择LLM节点,将模型设置为qwen-max。

单击右上角发布按钮,选择发布更新。

选择运行,进入测试页面,输入一个与知识库中内容相关的问题,即可获得答案。

同样,阿里云人工智能平台 PAI 支持在Dify 工作流中调用推理服务 PAI-EAS 部署的模型。使用阿里云人工智能平台 PAI 作为云端大模型部署资源,开启稳定、高效的 AI 开发新体验。

具体操作步骤为:

  1. 安装并启动 Dify;

2.使用 PAI-Model Gallery 零代码部署模型,如通义千问最新 Think 模型:Qwen3-235B-A22B-Thinking-2507;

  1. 返回Dify页面,配置 PAI 部署的模型调用地址等信息;

  2. 执行完整 Dify 工作流。

立即体验

我们诚邀您立即体验阿里云Milvus的强大功能!

免费试用:产品新用户可免费试用向量检索服务 Milvus 版入门 8 vCPU 32 GiB 1 个月和模型推理服务 PAI-EAS 500 元大模型部署额度(1个月内有效)。

领取地址:向量检索服务 Milvus 版 >> https://x.sm.cn/FXQT0f5;人工智能平台 PAI >> https://free.aliyun.com/?productCode=learn

年付5折:覆盖阿里云 Milvus 全规格产品。

节省计划:阿里云人工智能平台 PAI 预付活动低至3折,59可抵200、1080可抵1500、12000可抵15000,模型训练、部署等各阶段均适用,无机型和地域限制。

通用RAG超值套餐(PAI+Milvus ):https://common-buy.aliyun.com/package?spm=ntm.workbench-commodities-planlist-list.0.0.3b9619afGbhcFy&planCode=package_milvuspaieas_cn

欢迎前往产品详情页购买体验!https://www.aliyun.com/product/milvus

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论