Gbase全文索引查询原理

原创欧阳无敌 2022-07-01

362

从前面的分析知道，全文索引根据倒排索引数据进行检索。一个是利用文档倒排过滤出所包含所有查询词的文档，再利用文档偏移倒排进行位置偏移过滤。

doc过滤：

通过文档倒排，就是求每个查询词文档集合的交集。由于单词的文档集合具有有序性，这样就可以做两个有序集合的交集。使用双指针对比偏移算法求交集即可

hitoffset过滤：

只有需要对输入短语进行完全匹配时，需要。通过查询短语的偏移倒排序列和文档的偏移序列对比，查看一致情况。

gbase

「喜欢这篇文章，您的关注和赞赏是给作者最好的鼓励」

关注作者

Gbase全文索引查询原理

评论