当前位置: 首页 > news >正文

Elasticsearch 查询时 term、match、match_phrase、match_phrase_prefix 的区别

Elasticsearch 查询时 term、match、match_phrase、match_phrase_prefix 的区别

  • keyword 与 text 区别
  • term 查询
  • match 查询
  • match_phrase 查询
  • match_phrase_prefix 查询
  • 写在最后

在讲述 es 查询时 term、match、match_phrase、match_phrase_prefix 的区别之前,先来了解一下 es 文本字段类型 keyword、 text 的区别。

keyword 与 text 区别

在 es 创建索引中,经常会遇到 keyword 、text 字段类型的选择,其实他们之间的区别也比较容易理解。
keyword:在索引时,keyword类型的数据不会被分词器处理,而是直接作为整体存储到索引中。
text:在索引时,text类型的数据会经过分词器处理,将文本切分成多个词条,然后存储到索引中。
可以通过以下命令来查看分词结果,es 不指定分词器则走的是 es 默认的分词器(通常情况下都是单字)
查看 text 字段类型分词结果

POST /_analyze
{"text": "很高兴为您服务"
}

在这里插入图片描述
查看 keyword 字段类型分词结果

POST /_analyze
{"analyzer": "keyword", "text": "很高兴为您服务"
}

在这里插入图片描述

term 查询

term 查询用于精确值匹配,它不会对查询的文本进行分词处理,直接在索引中查找精确值。
适用场景:适用于关键字(keyword)类型的字段,或者已经过精确值(如数字、日期等)处理的文本字段。这里我用 term 查询来精确查询 convId属性字段

GET crm_meiqia_conversation_tmp/_search
{  "query": {  "bool": {  "must": [  {"term" : {"convId" : 6305271104}} ]}  }  
}

查询结果如图
在这里插入图片描述

match 查询

match 查询是一种全文搜索查询,它会对查询文本进行分词处理,然后搜索分词后的结果。它适用于 text 类型的字段。
适用场景:用于执行全文搜索,适合于搜索文本内容。这里我搜索一下索引中的 text 类型字段 ,由于表数据比较多,因此上一次查询的 convId 字段我还保留。

GET crm_meiqia_conversation_tmp/_search
{  "query": {  "bool": {  "must": [  {"term" : {"convId" : 6305271104}} ,{  "match": {  "convContent.content": "哦 一下 保存 "  }  }]}  }  
}

查询结果如图
在这里插入图片描述

match_phrase 查询

match_phrase 查询是一种精确短语匹配查询,它会在文本中查找包含指定短语的文档,同时考虑短语的顺序和位置。
适用场景:适用于需要精确匹配短语的场景,如引用搜索、精确短语匹配等。比如这里我们还查询上面的一段话,查看一下查询结果,顺序不对的话应是查询不到结果的

GET crm_meiqia_conversation_tmp/_search
{  "query": {  "bool": {  "must": [  {"term" : {"convId" : 6305271104}} ,{  "match_phrase": {  "convContent.content": "哦 一下 保存 "  }  }]}  }  
}

查询结果如图
在这里插入图片描述
这时候我调整一下查询内容的顺序后再次尝试,就可以查询到数据

GET crm_meiqia_conversation_tmp/_search
{  "query": {  "bool": {  "must": [  {"term" : {"convId" : 6305271104}} ,{  "match_phrase": {  "convContent.content": "保存 一下 "  }  }]}  }  
}

查询结果如图
在这里插入图片描述

match_phrase_prefix 查询

match_phrase_prefix 查询是 match_phrase 查询的一个变种,它允许对查询短语的最后一个单词进行前缀匹配。
适用场景:适用于需要匹配以特定前缀开头的短语且对查询精度要求较高的场景。这里查询要求前缀匹配,类似于 mysql 的 like 查询 的 “保存%”

GET crm_meiqia_conversation_tmp/_search
{  "query": {  "bool": {  "must": [  {"term" : {"convId" : 6305271104}} ,{  "match_phrase_prefix": {  "convContent.content": "保存 一下 "  }  }]}  }  
}

查询结果如图
在这里插入图片描述
更换一下顺序,就无法通过前缀匹配到内容了,比如

GET crm_meiqia_conversation_tmp/_search
{  "query": {  "bool": {  "must": [  {"term" : {"convId" : 6305271104}} ,{  "match_phrase_prefix": {  "convContent.content": "一下 保存"  }  }]}  }  
}

查询结果如图
在这里插入图片描述

写在最后

以上就是 Elasticsearch 查询时 term、match、match_phrase、match_phrase_prefix 的区别,大家根据具体适用的场景选择合适的查询语句哈。

http://www.lryc.cn/news/485851.html

相关文章:

  • 低代码平台:跨数据库处理的重要性与实现方式
  • 【jvm】如何破坏双亲委派机制
  • ReactPress与WordPress:一场内容管理系统的较量
  • 网络安全练习之 ctfshow_web
  • 在 Service Worker 中caches.put() 和 caches.add()/caches.addAll() 方法他们之间的区别
  • UNIAPP发布小程序调用讯飞在线语音合成+实时播报
  • 跳房子(弱化版)
  • ubuntu22 安装 minikube
  • STM32 | 超声波避障小车
  • 打造旅游卡服务新标杆:构建SOP框架与智能知识库应用
  • 通过脚本,发起分支合并请求和打tag
  • 【视频讲解】Python深度神经网络DNNs-K-Means(K-均值)聚类方法在MNIST等数据可视化对比分析...
  • 网络安全在线网站/靶场:全面探索与实践
  • Ceph 中Crush 算法的理解
  • D70【 python 接口自动化学习】- python 基础之数据库
  • C# LINQ数据访问技术
  • 【JavaSE线程知识总结】
  • FreeRTOS内存管理
  • 利用服务工作线程serviceWorker缓存静态文件css,html,js,图片等的方法,以及更新和删除及版本控制
  • MuMu模拟器安卓12安装Xposed 框架
  • 高级数据结构——hash表与布隆过滤器
  • 【网络】什么是交换机?switch
  • 软件测试 —— 自动化基础
  • 深入解析 OpenHarmony 构建系统-4-OHOSLoader类
  • 【Android、IOS、Flutter、鸿蒙、ReactNative 】实现 MVP 架构
  • 排序算法(基础)大全
  • Pytest从入门到精通
  • 《C++ 实现生成多个弹窗程序》
  • react 中 useRef Hook 作用
  • Scala-键盘输入(StdIn)-用法详解