从前面的分析知道,全文索引根据倒排索引数据进行检索。一个是利用文档倒排过滤出所包含所有查询词的文档,再利用文档偏移倒排进行位置偏移过滤。
doc过滤:
通过文档倒排,就是求每个查询词文档集合的交集。由于单词的文档集合具有有序性,这样就可以做两个有序集合的交集。使用双指针对比偏移算法求交集即可
hitoffset过滤:
只有需要对输入短语进行完全匹配时,需要。通过查询短语的偏移倒排序列和文档的偏移序列对比,查看一致情况。
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




