当前位置: 首页 > news >正文

Elasticsearch 分布式搜索——聚合

1.聚合的种类

聚合常见的有三类:

  • **桶(Bucket)**聚合:用来对文档做分组

    • TermAggregation:按照文档字段值分组,例如按照品牌值分组、按照国家分组
    • Date Histogram:按照日期阶梯分组,例如一周为一组,或者一月为一组
  • **度量(Metric)**聚合:用以计算一些值,比如:最大值、最小值、平均值等

    • Avg:求平均值
    • Max:求最大值
    • Min:求最小值
    • Stats:同时求max、min、avg、sum等
  • **管道(pipeline)**聚合:其它聚合的结果为基础做聚合

**注意:**参加聚合的字段必须是keyword、日期、数值、布尔类型

2.Bucket聚合语法

语法如下:

GET /hotel/_search
{"size": 0,  // 设置size为0,结果中不包含文档,只包含聚合结果"aggs": { // 定义聚合"brandAgg": { //给聚合起个名字"terms": { // 聚合的类型,按照品牌值聚合,所以选择term"field": "brand", // 参与聚合的字段"size": 20 // 希望获取的聚合结果数量}}}
}

结果:
在这里插入图片描述

3.聚合结果排序

默认情况下,Bucket聚合会统计Bucket内的文档数量,记为_count,并且按照_count降序排序。

我们可以指定order属性,自定义聚合的排序方式:

GET /hotel/_search
{"size": 0, "aggs": {"brandAgg": {"terms": {"field": "brand","order": {"_count": "asc" // 按照_count升序排列},"size": 20}}}
}

结果:
在这里插入图片描述

4.限定聚合范围

默认情况下,Bucket聚合是对索引库的所有文档做聚合,但真实场景下,用户会输入搜索条件,因此聚合必须是对搜索结果聚合。那么聚合必须添加限定条件。

我们可以限定要聚合的文档范围,只要添加query条件即可:

GET /hotel/_search
{"query": {"range": {"price": {"lte": 200 // 只对200元以下的文档聚合}}}, "size": 0, "aggs": {"brandAgg": {"terms": {"field": "brand","size": 20}}}
}

5.Metric聚合语法

我们对酒店按照品牌分组,形成了一个个桶。现在我们需要对桶内的酒店做运算,获取每个品牌的用户评分的min、max、avg等值。

这就要用到Metric聚合了,例如stat聚合:就可以获取min、max、avg等结果。

语法如下:

GET /hotel/_search
{"size": 0, "aggs": {"brandAgg": { "terms": { "field": "brand", "size": 20},"aggs": { // 是brands聚合的子聚合,也就是分组后对每组分别计算"score_stats": { // 聚合名称"stats": { // 聚合类型,这里stats可以计算min、max、avg等"field": "score" // 聚合字段,这里是score}}}}}
}

在这里插入图片描述

http://www.lryc.cn/news/150702.html

相关文章:

  • 苹果将在iPhone16系列中引入微透镜阵列技术,亮度更高、功耗更低
  • Window10 安装 Lua
  • Centos替代方案分析(Ubuntu篇)
  • 关于计数以及Index返回订单号升级版可以控制年月日累计(不重复)(sqlite)
  • 前端实现在线预览文件
  • 海外有哪些流行的支付方式?
  • 服务器数据恢复-重组RAID导致RAID6数据丢失的数据恢复案例
  • Redis数据库持久化---RDB(Redis DataBase)概念与实操
  • 分部署存储Ceph
  • 项目:点餐系统3mysql知识回顾MySQL客户端
  • docker命令学习
  • 【STM32教程】第二章 通用输入输出口GPIO
  • 2023.9 - java - ArrayList
  • 记1次前端性能优化之CPU使用率
  • 记一次postgres导致cpu100%
  • 详谈SpringBoot启动项目后执行自定义方法的方式
  • KubeAdmin方式搭建K8S(1.26.0)
  • 代码随想录打卡—day57—【编辑距离】— 9.2+9.3 编辑距离系列
  • Blender界面学习03 原点、鼠标所在位置的缩放与旋转
  • 指针结构体题
  • 【力扣每日一题02】数组篇--删除有序数组中的重复项
  • Vue在表格中拿到该行信息的方式(作用域插槽-#default-scope-解决按钮与行点击的顺序问题)
  • OJ练习第158题——单词拆分 II
  • ArcGIS地块面积分割调整工具插件
  • 基于Matlab实现多个图像增强案例(附上源码+数据集)
  • 计算机网络 概述部分
  • 使用DOSBOX运行TurboC2,TC2使用graphics库绘图
  • OpenCV(二):认识Mat容器
  • springboot整合Excel填充数据
  • c语言技术面试记录 ---- 纲要、题目、分析及给分标准