Dify 在最新的开源版本中集成了 SQL 向量数据库 MyScaleDB,并支持向量检索、全文检索和混合检索。现在,开发者不仅能利用 MyScaleDB 强大的 SQL 能力与向量搜索功能,还能通过 Dify 的直观界面轻松编排和调试 prompt,快速创建智能客服、文本生成等多种 AI 应用。此次集成让 AI 应用开发变得前所未有的简单有趣,为 AI 社区注入了更多活力与创意。
介绍 Dify
Dify 是新一代开源的大型语言模型应用开发平台,旨在帮助开发者更简单、快速地构建和运营AI 应用。它具有以下主要特点和功能:
可视化 Prompt 编排:通过界面化编写和调试 prompt,使开发者能够快速创建 AI 应用。
数据集管理:支持上传和管理企业知识库或产品文档,用于构建基于特定领域知识的 AI 应用。
API 集成:提供封装友好的 API,可以轻松集成到现有系统中。
开箱即用的 WebApp:提供可直接使用的网页应用界面,也支持二次开发。
多模型支持:集成了多种大语言模型,如 OpenAI GPT 系列、Claude 等,方便开发者选择和比较。
低代码开发:提供可视化界面,使得非技术人员也能参与AI应用的创建和优化。
运营和分析工具:包括数据标注、日志分析等功能,帮助持续改进 AI 应用的性能。
Dify 的设计理念是让 AI 应用开发变得像使用云计算服务一样简单,开发者无需深入了解底层技术细节,就能快速将创意转化为实际可用的 AI 应用。它适合用于构建各种场景的 AI 应用,如智能客服、基于企业知识库的问答系统、文本生成工具等。
在 Dify 中使用 MyScaleDB
创建 MyScale Cluster
Dify 支持开源版 MyScaleDB 或企业版 MyScale Cloud,如果希望使用开源版 MyScaleDB,可以跳过本节。
如果希望使用 MyScale Cloud,请首先访问 https://console.myscale.com 注册并登录,然后点击右上角的 New Cluster 按钮,开始创建 MyScale Cluster。

输入 Cluster name 后,点击 Next 按钮,等待 Cluster 启动完成。

把鼠标移至 Cluster 右侧的 Actions 按钮,点击弹出列表中的 Connection Details,记录 Python 标签页中的 host/port/username/password 信息,用于后续配置 Dify 对 MyScale Cluster 的访问。

配置和运行 Dify
在 Dify 中使用 MyScaleDB,首先需要部署 Dify 社区版,推荐参考官方文档。
https://docs.dify.ai/v/zh-hans/getting-started/install-self-hosted/docker-compose
使用 docker compose 启动 dify 之前,修改 .env 文件,填写 MyScale 相关配置:
首先将 VECTOR_STORE 改为 myscale:
VECTOR_STORE=myscale
如果使用 MyScale Cloud 版本,按照网页上获取到的信息修改对应配置( MYSCALE_DATABASE 可以不改);如果希望使用开源版 myscaledb,下列配置可以保持不变:
MYSCALE_HOST=myscaleMYSCALE_PORT=8123MYSCALE_USER=defaultMYSCALE_PASSWORD=MYSCALE_DATABASE=dify
如果需要支持多语言,比如中文的文档,请参考 MyScale 官方文档配置 MYSCALE_FTS_PARAMS 参数。例如使用中文分词器,MyScaleDB 中创建全文索引的 SQL 如下(文本信息在 MyScale 表中的 column name 为 text):
MyScale 官方文档:
https://myscale.com/docs/zh/text-search/
ALTER TABLE [table_name] ADD INDEX text_idx textTYPE fts('{"text":{"tokenizer":{"type":"chinese", "case_sensitive":false}}}');
相对应地修改 MYSCALE_FTS_PARAMS 为:
MYSCALE_FTS_PARAMS='{"text":{"tokenizer":{"type":"chinese", "case_sensitive":false}}}'
修改完毕后,启动 Dify:
docker compose up -d
在浏览器中访问 http://localhost 使用 Dify。
在 Dify 知识库中,你可以选择使用 MyScaleDB,且 MyScaleDB 同时支持向量检索、全文检索和混合检索,可以在创建知识库时选择检索方式。
对开发人员的好处
开发门槛极低
Dify 通过简化开发流程、提供可视化工具和各种开箱即用的功能,创造低代码开发环境,让开发者甚至非技术人员都能参与 AI 应用的创建和优化。而 MyScaleDB 完全兼容 SQL,开发者可以使用熟悉的 SQL 语法进行向量搜索、过滤搜索和 SQL-向量联合查询等操作,无需学习复杂的新工具或框架。另外,MyScaleDB 还提供了统一的平台来管理和处理结构化数据、向量数据、文本等多种类型的数据,简化了开发流程。两者的结合大大降低了 AI 应用开发和运营的门槛,使得更多开发者能够快速构建和扩展 AI 应用。
高性能和可扩展性
Dify 内置了高质量的 RAG(检索增强生成)引擎,可以有效提升基于知识库的 AI 应用的准确性和响应速度。Dify 的设计支持应用的快速扩展,可以随着业务需求的增长轻松扩展AI应用的规模和功能。另外,Dify 还提供包括提示词工程、上下文管理、日志分析和数据标注等功能,帮助用户持续优化 AI 应用。
MyScaleDB 利用先进的 OLAP 数据库架构和自研的先进 MSTG 向量算法,不仅可以轻松地扩展应用,还能保证快速地向量搜索。MyScale Telemetry 提供了类似于 LangSmith 的功能,用于改进 LLM 应用程序的可观察性和评估。通过与 LangChain Callbacks 无缝集成, 它捕获详细的跟踪数据并将其存储在 MyScaleDB 中,从而便于诊断问题、优化性能和了解应用程序行为。
写在最后
展望未来,MyScaleDB 和 Dify 将继续探索 AI 创新应用的更多新方向。我们相信,这将为开发者带来更多便捷、高效的工具,推动 AI 技术在各个领域的广泛应用。
了解墨奇科技 点击更多资讯






