暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

GBase 8a更新全文索引

424

全文索引更新是指数据源内容与索引内容的同步操作,在数据源内容变化的情况 下,索引也需要同步更新,以保持一致,更新全文索引的方式为批量手动更新 (manual)模式,即通过相应的 SQL 语句来同步数据与索引内容。

语法格式

UPDATE INDEX index_name ON table_name [WITH ANALYZE];


全文检索的许多场景应用是对大数据文件的搜索查询,这些大数据文件格式各异, 可能是 HTML、doc、pdf、txt、XML、zip 等多种文件格式,属于非结构化数据 文件。 由于数据库的 VARCHAR、BLOB 和 TEXT 等字段类型都有上限约束,不适合直 接存储非结构化的数据文件,为此增加了 URI 类型,在数据库中只保存非结构化 数据文件的 URI 元信息(含文件存储路径、文件类型、校验等信息),将数据文 件实体存储在数据库之外的文件系统中,通过 URI 的内容来实现对非结构化数据 文件的检索和查询。 GBase 8a MPP Cluster 全文检索 URI 类型支持的文件格式有 HTML、doc、pdf、txt、 XML、zip、blob URI 文件格式,可正常解析这些文件格式中的内容并能建立全文 索引。针对 zip 文件,能够解析 zip 文件压缩包中的具体文件的内容。

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论