DeepSeek持续火热，看看国产数据库怎么玩

数据最前线 2025-02-17

DeepSeek火热已经持续一段时间，各个行业掀起了AI大模型对接的热潮，数据库作为基础架构的核心自然也不例外。早在2024年5月份数据库巨头Oracle便宣布全面支持AI向量数据库，并将其新一代数据库产品命名为23ai，向世界宣示其AI能力以及未来向AI方向发展的决心。国产数据库方面也有一些厂商在快速跟进，今天我们来聊聊这方面的情况。

OceanBase SQL+AI，构建AI助手

2024年下半年发布的OceanBase 4.3.3 GA版本中新增了向量检索能力，支持向量数据类型、向量索引以及基于向量索引的搜索能力，只需要一套数据库即可满足文档存储、标量过滤、向量检索和全文检索等多种需求。

OceanBase在gitee上给出了一个Workshop (https://gitee.com/oceanbase-devhub/ai-workshop-2024) ，使用通用语义向量模型BGE-M3 (那时候DeepSeek还没火起来^_^)，提供多语言检索、不同粒度文本输入及多向量检索能力，可以基于这个Workshop搭建一个简易的AI助手。

GBase 8c + DeepSeek 构建本地知识库

近期GBase数据库公众号发表文章，展示了利用GBase 8c + DeepSeek来构建本地知识库的案例。其中文本嵌入模型选用的是开源的nomic-embed-text，在处理短文和长文本任务方面有较大的优势；文本生成模型则选用DeepSeek-r1，能够更好的捕捉文本中的语义信息，为文本生成带来更出色的效果；而数据库则用于在本地存储私域知识库，实现快速向量化检索的同时提供更加稳定、安全的数据防护。

在仅使用DeepSeek进行提问时，模型的回答显得有些不着边际，毕竟国产数据库还是非常专业的一个领域。