当前位置: 首页 > news >正文

SQLite 全文检索:快速高效的文本查询方案

文章目录

  • 什么是全文检索?
  • 如何启用 FTS?
  • 插入数据
  • 执行全文检索
  • 关联原始表与 FTS 表
  • 数据更新
  • 结论

说明: 本文以博客内容全文检索为例。

什么是全文检索?

全文检索是指对文本数据进行索引和查询的一种技术。与常规的 LIKE 查询不同,全文检索通过对文本建立倒排索引,可以更快地处理文本搜索,尤其在涉及大量数据时,性能优势尤为明显。

SQLite 中,使用 FTS5 模块可以轻松实现全文检索功能。该模块是一个虚拟表模块,允许你创建一个可以进行全文索引的表。

如何启用 FTS?

SQLite 中启用全文检索的前提是 SQLite 已经支持 FTS5(通常默认支持)。我们可以使用以下命令创建一个支持全文检索的表:

CREATE VIRTUAL TABLE blog_posts_fts USING fts5(id, title, content);

上述命令创建了一个名为 blog_posts_fts 的虚拟表,其中包含 idtitlecontent 三个字段,并为 titlecontent 字段建立了全文索引。

插入数据

由于 FTS 表是虚拟表,因此无法直接与普通表同步数据,需要手动将数据插入到 FTS 表中。示例代码如下:

INSERT INTO blog_posts_fts (id, title, content)
SELECT id, title, content FROM blog_posts;

这会将 blog_posts 表中的所有数据同步到 blog_posts_fts 表中,以供全文检索使用。

执行全文检索

执行全文检索时,可以使用 MATCH 语法来查询文本内容。以下示例展示了如何搜索包含关键字 SQLite 的文章:

SELECT id, title, content
FROM blog_posts_fts
WHERE blog_posts_fts MATCH 'SQLite';

这种方式可以在大量数据中快速找到与关键字匹配的结果。

关联原始表与 FTS 表

为了方便获取更多的元数据(如日期、作者等),我们可以通过 id 关联 FTS 表与原始的 blog_posts 表。例如:

SELECT bp.id, bp.title, bp.date, fts.content
FROM blog_posts bp
JOIN blog_posts_fts fts ON bp.id = fts.id
WHERE fts MATCH 'SQLite'
ORDER BY bp.date DESC;

这样,你就可以在检索的同时获取完整的博客信息,并按日期进行排序。

数据更新

blog_posts 表的数据发生变化时,需要同步更新到 blog_posts_fts 表。你可以手动更新,也可以使用触发器自动同步:

CREATE TRIGGER after_blog_posts_insert
AFTER INSERT ON blog_posts
BEGININSERT INTO blog_posts_fts (id, title, content)VALUES (NEW.id, NEW.title, NEW.content);
END;CREATE TRIGGER after_blog_posts_update
AFTER UPDATE ON blog_posts
BEGINUPDATE blog_posts_ftsSET title = NEW.title, content = NEW.contentWHERE id = NEW.id;
END;CREATE TRIGGER after_blog_posts_delete
AFTER DELETE ON blog_posts
BEGINDELETE FROM blog_posts_fts WHERE id = OLD.id;
END;

触发器会确保 FTS 表自动更新,不需要手动同步。

结论

SQLite 提供了功能强大的 FTS 模块,能够显著提高文本数据查询的效率。通过建立全文检索索引,可以轻松地在大量文本数据中找到相关的记录。在实际项目中,如果有大量的文本数据需要搜索,SQLiteFTS 功能不失为一种简便而有效的解决方案。

http://www.lryc.cn/news/484479.html

相关文章:

  • 【微信小程序】报修管理
  • C++——视频问题总结
  • Ubuntu24.04 network:0 unclaimed wireless adapter no found
  • Java 使用MyBatis-Plus数据操作关键字冲突报错You have an error in your SQL syntax问题
  • 深入浅出 ChatGPT 底层原理:Transformer
  • opc da 服务器数据 转 IEC61850项目案例
  • SystemVerilog学习笔记(十一):接口
  • 华大单片机跑历程IO口被写保护怎么解决
  • Iotop使用
  • 定积分的快速计算技巧
  • 第T7周:Tensorflow实现咖啡豆识别
  • imagehash图片去重:保留图片文件名
  • 在Docker环境下为Nginx配置HTTPS
  • vue面试题9|[2024-11-15]
  • 大数据技术在金融风控中的应用
  • 安装一键式重置密码插件(Linux)-CloudResetPwdAgent
  • 如何平滑切换Containerd数据目录
  • 月影和米家大路灯哪个好?书客、月影、米家谁会更胜一筹!
  • instanceof 的模式匹配(二)
  • 【Spring】Bean的作用域和Spring的执行流程
  • 自动驾驶系列—从数据采集到存储:解密自动驾驶传感器数据采集盒子的关键技术
  • QtWebServer
  • 网络基础概念与应用:深入理解计算机网络
  • <el-select> :remote-method用法
  • CKA认证 | Day3 K8s管理应用生命周期(上)
  • JavaWeb——HTML、CSS
  • springboot如何获取控制层get和Post入参
  • 30 秒!用通义灵码画 SpaceX 星链发射流程图
  • 设计模式之组合模式(营销差异化人群发券,决策树引擎搭建场景)
  • 关于做完 C# 项目的问题总结