当前位置：首页 > news >正文

谷粒商城实战笔记-129-商城业务-商品上架-nested数据类型场景

news 2025/7/28 15:20:46

文章目录

- - 扁平化处理
  - - 扁平化处理导致的检索问题
  - 解决方案：使用 nested 结构

在es的数据类型中有一个nested类型，本讲将重点讨论这个类型。

扁平化处理

PUT my_index/doc/1
{"group" : "fans","user" : [{"first" : "John","last" : "Smith"},{"first" : "Alice","last" : "White"}]
}

在这里插入图片描述

如图所示，有一个名为 my_index 的索引，其中包含一个文档，该文档有一个名为 group 的字符串字段和一个名为 user 的数组字段，该数组包含两个对象。

首先看看如何在 Elasticsearch 中处理此数据，然后讨论如何解决扁平化处理带来的挑战。

默认情况下，Elasticsearch 将尝试将数组内的对象展平。在这种情况下，Elasticsearch 可能会将 user 数组展平为以下形式：

{"group": "fans","user.first": ["John", "Alice"],"user.last": ["Smith", "White"]
}

然而，这种扁平化处理并不能很好地反映原始数据结构，因为它丢失了用户对象的上下文。

扁平化处理导致的检索问题

因此，我们在查询时会遇到下面的问题。

GET my_index/_search
{"query": {"bool": {"must": [{"match": {"user.first": "Alice"}},{"match": {"user.last": "Smith"}}]}}
}

在这里插入图片描述

在扁平化处理下，user 数组中的对象会被展平为单独的字段，例如 user.first 和 user.last。这意味着每个用户对象的属性都会被拆分为独立的字段，而不是作为一个整体存储。

在给定的查询中，要匹配一个 user 对象，其中 first 属性等于 “Alice”，last 属性等于 “Smith”。由于扁平化处理，user.first 和 user.last 字段分别包含 “John”、“Alice” 和 “Smith”、“White”，而不是完整的 “Alice Smith”。

在扁平化处理的情况下，这个查询可能会返回错误的结果，即使文档中不存在一个完整的 “Alice Smith” 用户。这是因为查询引擎会将 “Alice” 和 “Smith” 视为独立的关键词，而不是一个完整的姓名。因此，只要文档中存在一个 user.first 匹配 “Alice” 和一个 user.last 匹配 “Smith”，无论它们是否来自同一个用户对象，都会被视为匹配项。

对于上图中的查询，语义是要查找一个叫做“Alice Smith”的人，实际上并没有这样一个人，但是因为ES的扁平化处理，检索过程如下：

首先会在user.first中查找Alice，能够匹配到一条记录
接着在user.last中查找Smith，也能够匹配到

最后能查到两条记录，与预期不符。

解决方案：使用 nested 结构

为了避免这些问题，我们可以使用 nested 类型来存储 user 数组。以下是使用 nested 类型的映射定义：

PUT my_index
{"mappings": {"properties": {"group": { "type": "keyword" },"user": {"type": "nested","properties": {"first": { "type": "keyword" },"last": { "type": "keyword" }}}}}
}

现在，我们可以将相同的数据插入到索引中，但这次使用 nested 结构：

PUT my_index/doc/1
{"group": "fans","user": [{ "first": "John", "last": "Smith" },{ "first": "Alice", "last": "White" }]
}

使用 nested 结构的好处在于，它可以保留数组中每个对象的完整结构。这意味着我们可以对 user 数组中的单个元素执行更复杂的查询，而不仅仅是简单的过滤。

例如，我们可以查询姓氏为 White 的用户：

GET my_index/_search
{"query": {"nested": {"path": "user","query": {"term": {"user.last.keyword": "White"}}}}
}

上述查询将返回所有包含至少一个姓氏为 White 的用户。

使用 nested 结构可以帮助我们更好地处理对象数组，特别是当我们需要执行更复杂的查询时。虽然 nested 结构可能会带来更高的存储成本和查询性能影响，但它提供了更大的灵活性和准确性。

查看全文

http://www.lryc.cn/news/415152.html

axios请求响应拦截器

Python 中单例模式实现的几种方式

mysql数据库触发器同步数据

Prometheus-v2.45.0+Grafana+邮件告警

LeetCode——572. 另一颗树的子树

Spring Boot整合MyBatis-Flex

重塑未来体验：边缘计算与云原生的完美邂逅

浅谈基础数论（c++）

jdk 17新特性 sealed 关键字

在仪器计量校准中，无尘车间洁净室检测有哪些方法和流程？

【跨时代】第四次工业革命彻底来袭！什么是AI+

前端性能优化-纲领篇

深度学习-----------数值稳定性

SpringBoot项目接口可以承受的调用次数

抽象代数精解【8】

数据结构与算法 - 二叉树

Spring Cloud Gateway如何给一个请求加请求头

chromedriver版本下载地址汇总chromedriver所有版本下载地址汇总国内源下载

Go语言与Windows系统

JAVA—面向对象编程高级

[BJDCTF2020]Mark loves cat1

微信答题小程序产品研发-用户操作流程设计

目标检测——YOLOv10: Real-Time End-to-End Object Detection

堡垒机简单介绍

【星闪开发连载】WS63E 星闪开发板和hi3861开发板的对比

Python接口自动化测试框架（实战篇）-- Jenkins持续集成

【leetcode】根据二叉树创建字符串、二叉树的前中后遍历（非递归链表实现二叉树）

【RabbitMQ】RabbitMQ交换机概述

ROS2从入门到精通4-6：路径平滑插件开发案例(以B样条曲线平滑为例)

Tensorflow训练视觉模型（CPU）

文章目录

扁平化处理

扁平化处理导致的检索问题

解决方案：使用 nested 结构

相关文章：