坚持学习openGauss数据库,坚持每天打卡。第二十天学习openGauss全文检索。
连接openGauss
root@modb:~# su - omm omm@modb:~$ gsql -r gsql ((opengauss 2.0.0 build 78689da9) compiled at 2021-03-31 21:03:52 commit 0 last mr ) non-ssl connection (ssl connection is recommended when requiring high-security) type "help" for help. omm=#
1.用tsvector @@ tsquery和tsquery @@ tsvector完成两个基本文本匹配
omm=# select 'China is a great country'::tsvector @@ 'China & great'::tsquery as result;
result
--------
t
(1 row)
omm=# select 'country & great'::tsquery @@ 'Japan is a small place'::tsvector as result;
result
--------
f
(1 row)
2.创建表且至少有两个字段的类型为 text类型,在创建索引前进行全文检索
omm=# create schema schema1;
CREATE SCHEMA
omm=# create table schema1.tab(id int, body text, title text, last_mod_date date);
CREATE TABLE
omm=# insert into schema1.tab values(1, 'China, officially the People''s Republic of China(PRC), located in Asia, is the world''s most populous state.', 'China', '2021-12-20'),(2, 'America is a rock band, formed in England in 1970 by multi-instrumentalists Dewey Bunnell, Dan Peek, and Gerry Beckley.', 'America', '2021-12-20'),(3, 'England is a country that is part of the United Kingdom. It shares land borders with Scotland to the north and Wales to the west.', 'England','2021-12-20');
INSERT 0 3
--检索出在title或者body字段中包含china和asia的行
omm=# select title from schema1.tab where to_tsvector(title || ' ' || body) @@ to_tsquery('china & asia');
title
-------
China
(1 row)
3.创建GIN索引
--为了加速文本搜索,可以创建GIN索引(指定China配置来解析和规范化字符串)
omm=# create index tab_idx_1 on schema1.tab using gin(to_tsvector('english', body));
CREATE INDEX
--连接列的索引
omm=# create index tab_idx_3 on schema1.tab using gin(to_tsvector('english', title || ' ' || body));
CREATE INDEX
4.清理数据
omm=# drop schema schema1 cascade;
NOTICE: drop cascades to table schema1.tab
DROP SCHEMA
通过学习openGauss全文检索,了解到openGauss提供了两种数据类型用于支持全文检索。tsvector类型表示为文本搜索优化的文件格式,tsquery类型表示文本查询。全文检索基于匹配算子@@,当一个tsvector匹配到一个tsquery时,则返回true, tsvector和tsquery两种数据类型可以任意排序。
「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。




