当前位置: 首页 > news >正文

【MySQL精通之路】全文搜索(3)-带查询扩展的全文搜索

博主PS:你可以把他理解为,查询猜测,膨胀查询,查询的第六感。

全文搜索支持查询扩展(尤其是其变体“盲查询扩展”)。

当搜索短语太短时,这通常很有用,这通常意味着用户依赖于全文搜索引擎所缺乏的隐含意义。

例如,用户搜索“数据库”可能意味着“MySQL”、“Oracle”、“DB2”和“RDBMS”都是与“数据库”匹配的短语,也应该返回。这是隐含的意义。

通过在搜索短语后面添加WITH QUERY EXPANSIONIN NATURAL LANGUAGE MODE WITH QUERY EXPANSION,可以启用盲查询扩展(也称为自动相关性反馈)。

它的工作原理是执行两次搜索,其中第二次搜索的搜索短语是与第一次搜索中的少数几个最相关的文档连接的原始搜索短语

因此,如果这些文档中有一个包含单词“databases”和单词“MySQL”,则第二次搜索会找到包含单词“MySQL”的文档,即使它们不包含单词“数据库”。以下示例显示了这种差异:

mysql> SELECT * FROM articlesWHERE MATCH (title,body)AGAINST ('database' IN NATURAL LANGUAGE MODE);
+----+-------------------+------------------------------------------+
| id | title             | body                                     |
+----+-------------------+------------------------------------------+
|  1 | MySQL Tutorial    | DBMS stands for DataBase ...             |
|  5 | MySQL vs. YourSQL | In the following database comparison ... |
+----+-------------------+------------------------------------------+
2 rows in set (0.00 sec)mysql> SELECT * FROM articlesWHERE MATCH (title,body)AGAINST ('database' WITH QUERY EXPANSION);
+----+-----------------------+------------------------------------------+
| id | title                 | body                                     |
+----+-----------------------+------------------------------------------+
|  5 | MySQL vs. YourSQL     | In the following database comparison ... |
|  1 | MySQL Tutorial        | DBMS stands for DataBase ...             |
|  3 | Optimizing MySQL      | In this tutorial we show ...             |
|  6 | MySQL Security        | When configured properly, MySQL ...      |
|  2 | How To Use MySQL Well | After you went through a ...             |
|  4 | 1001 MySQL Tricks     | 1. Never run mysqld as root. 2. ...      |
+----+-----------------------+------------------------------------------+
6 rows in set (0.00 sec)

另一个例子可能是搜索Georges Simenon关于Maigret的书籍,当用户不确定如何拼写“Maigret”时。在搜索“Megre和不情愿的证人”时,只找到了“Maigret和不情愿证人”,没有进行查询扩展。带有查询扩展的搜索会在第二遍中找到所有带有单词“Maigret”的书籍。

注意:

因为盲查询扩展往往会通过返回不相关的文档来显著增加噪声,所以只有在搜索短语较短时才使用它。

http://www.lryc.cn/news/355142.html

相关文章:

  • 【面试必看】Java并发
  • C++的第一道门坎:类与对象(一)
  • 经典面试题:MySQL如何调优?
  • 【程序员如何送外卖】
  • 【git pull 和 push详解】
  • 数据挖掘导致直接路径读(direct path read)耗尽了IO
  • 用队列实现栈 用栈实现队列 设计循环队列
  • BFS解决最短路问题(详解)
  • 按尺寸筛选轮廓图中的轮廓
  • VBA高级应用30例:实现在列表框内及列表框间实现数据拖动
  • 「AIGC算法」R-tree算法
  • 2024软考上半年嵌入式系统设计师考试回顾
  • MIT6.828 Lab2-1 Using gdb
  • mysqldump提示Using a password on the command line interface can be insecured的解决办法
  • Java毕业设计 基于springboot vue考勤管理系统
  • C数据结构:二叉树
  • 使用Nginx作为反向代理实现MQTT内外网通信
  • SpringBoot 上传文件示例
  • 9.js函数
  • 关于数据库和数据表的基础SQL
  • 【C语言深度解剖】(14):结构体内存对齐(详细配图讲解)
  • 学习笔记:C语言的32个关键字
  • 嵌入式学习 (Day:27 IPC --- 进程间通信)
  • Python考试复习--day2
  • 整理好了!2024年最常见 20 道 Redis面试题(九)
  • IDEA使用Maven打包项目的所有的依赖
  • 【C++ 】学习问题及补充
  • 内存泄漏案例分享3-view的内存泄漏
  • 红外超声波雷达测距
  • AIGC 008-IP-Adapter文本兼容图像提示适配器用于文本到图像扩散模型