当前位置: 首页 > news >正文

【Elasticsearch】bucket_sort

Elasticsearch 的`bucket_sort`聚合是一种管道聚合,用于对父多桶聚合(如`terms`、`date_histogram`、`histogram`等)的桶进行排序。以下是关于`bucket_sort`的详细说明:

1.基本功能

`bucket_sort`聚合可以对父聚合返回的桶进行排序,支持以下排序依据:

• `_key`:基于桶的键值(例如时间戳或词项)。

• `_count`:基于桶中的文档数量。

• 子聚合结果:基于子聚合的计算结果(例如`sum`、`avg`等)。

此外,`bucket_sort`还可以通过`from`和`size`参数截断结果,只返回部分桶。

2.参数说明

`bucket_sort`聚合的主要参数包括:

• `sort`:指定排序字段和顺序(升序或降序)。

• `from`:跳过前`N`个桶。

• `size`:返回的桶数量。

• `gap_policy`:当数据中存在缺口时的处理策略,默认为`skip`。

3.使用场景

3.1按子聚合结果排序

假设有一个`sales`索引,包含交易数据,我们希望按月统计销售额,并返回销售额最高的 3 个月:

```json

POST /sales/_search

{

  "size": 0,

  "aggs": {

    "sales_per_month": {

      "date_histogram": {

        "field": "date",

        "calendar_interval": "month"

      },

      "aggs": {

        "total_sales": {

          "sum": {

            "field": "price"

          }

        },

        "sales_bucket_sort": {

          "bucket_sort": {

            "sort": [

              {

                "total_sales": {

                  "order": "desc"

                }

              }

            ],

            "size": 3

          }

        }

      }

    }

  }

}

```

此查询将返回销售额最高的 3 个月。

3.2仅截断结果

如果不进行排序,仅截断结果,可以省略`sort`参数。例如,仅返回第 2 个桶:

```json

POST /sales/_search

{

  "size": 0,

  "aggs": {

    "sales_per_month": {

      "date_histogram": {

        "field": "date",

        "calendar_interval": "month"

      },

      "aggs": {

        "bucket_truncate": {

          "bucket_sort": {

            "from": 1,

            "size": 1

          }

        }

      }

    }

  }

}

```

此查询将仅返回第 2 个桶。

4.与其他聚合结合使用

`bucket_sort`可以与多种聚合结合使用,例如:

• `date_histogram`:按时间间隔分桶并排序。

• `histogram`:按数值间隔分桶并排序。

5.注意事项

• `bucket_sort`是管道聚合,执行顺序在非管道聚合之后。

• 排序和截断操作仅对父聚合返回的桶生效。

通过以上方式,`bucket_sort`聚合可以灵活地对聚合结果进行排序和截断,满足多种数据分析需求。

http://www.lryc.cn/news/535343.html

相关文章:

  • k8s证书过期怎么更新?
  • 活动预告 |【Part 1】Microsoft 安全在线技术公开课:通过扩展检测和响应抵御威胁
  • AIGC-微头条爆款文案创作智能体完整指令(DeepSeek,豆包,千问,Kimi,GPT)
  • C# 比较两个List集合内容是否相同
  • vue2 多页面pdf预览
  • 【python】matplotlib(animation)
  • Hello Robot 推出Stretch 3移动操作机器人,赋能研究与商业应用
  • 从零到一:我的元宵灯谜小程序诞生记
  • Docker 安装与配置 Nginx
  • Oracle常见语法
  • 在Vue3中使用Echarts的示例 两种方法
  • 【docker】docker改动镜像并重新编译举例
  • 具身智能训练新思路!将生成视频用于训练机器人
  • 15、深度学习-自学之路-反向传播程序展示、激活函数的应用,反向权重的更新、2层神经网络的应用,输入输出相关性的理解。
  • 【JavaEE进阶】依赖注入 DI详解
  • 医疗影响分割 | 使用 Swin UNETR 训练自己的数据集(3D医疗影像分割教程)
  • IGBT的两级关断
  • 微服务与网关
  • “云计算一哥”一口气发布6个大模型、3nm芯片!多模态还要搞Any-to-Any
  • pytest生成报告no tests ran in 0.01s
  • 如何修改DNS解析?
  • PyTorch 中 `torch.cuda.amp` 相关警告的解决方法
  • 微服务组件LoadBalancer负载均衡
  • 如何本地部署DeepSeek
  • vite + axios 代理不起作用 404 无效
  • centos7 升级openssl并安装python3
  • 使用 SDKMAN! 在 Mac(包括 ARM 架构的 M1/M2 芯片)上安装 Java 8
  • 【干活分享】2025年可以免费问答的一些GPT网站-deepseek等免费gpt
  • 20250211解决荣品的RK3566核心板在Android13下出现charge_extrem_low_power的问题
  • MapReduce到底是个啥?