当前位置: 首页 > news >正文

ElasticSearch父子索引实战

在这里插入图片描述

关于父子索引

ES底层是Lucene,由于Lucene实际上是不支持嵌套类型的,所有文档都是以扁平的结构存储在Lucene中,ES对父子文档的支持,实际上也是采取了一种投机取巧的方式实现的.

父子文档均以独立的文档存入,然后添加关联关系,且父子文档必须在同一分片,由于父子类型文档并没有减少文档数量,而且增加了父子绑定关系,会导致查询效率低下,因此我们并不建议您在实际开发中使用父子类型.

ES本身更适合"大宽表"模式,不要带着传统关系型数据库那种思维方式去使用ES,我们完全可以通过把多张表中的字段和内容合并到一张表(一个索引)中,来完成期望功能,尽可能规避父子类型的使用,不仅效率高,功能也更强大。

建议

如果对文档的写多于读,那么建议你选择父子类型,如果文档读多于写, 那么请选择嵌套类型。

对比嵌套文档

父子文档在理解上来说,可以理解为一个关联查询,有些类似MySQL中的JOIN查询,通过某个字段关系来关联。
父子文档与嵌套文档主要的区别在于,父子文档的父对象和子对象都是独立的文档,而嵌套文档中都在同一个文档中存储。

父-子关系的主要优势有:

  • 更新父文档时,不会重新索引子文档。
  • 创建,修改或删除子文档时,不会影响父文档或其他子文档。这一点在这种场景下尤其有用:子文档数量较多,并且子文档创建和修改的频率高时。
  • 子文档可以作为搜索结果独立返回。

实战案例

本篇以博客文章和评论作为文档模型,演示文章和评论这个一对多的父子关系,增删改查如何操作。
假设数据如下:

[{"title":"这是一篇博文","content":"适当方式连接管理工具螺丝钉解放了送到房间里伺机待发..."},{"username":"Jack","comment":"nice post, good job!","date":"2023-09-04"},{"username":"王老五","comment":"写得很一般啊","date":"2023-08-04"},{"username":"技术我最牛","comment":"仅次于我","date":"2022-05-01"}
]

创建索引

创建blog索引,父文档与子文档分别用不同的字段来存储对应的数据,在创建索引文档的时需要指定父子文档的关系,即文章为parent,评论为child,创建索引语句如下:
在这里插入图片描述

{"mappings": {"properties": {"date": {"type": "date"},"username": {"type": "text","fields": {"keyword": {"type": "keyword"}}},"comment": {"type": "text","fields": {"keyword": {"type": "keyword"}}},"content": {"type": "text","fields": {"keyword": {"type": "keyword"}}},"title": {"type": "text","fields": {"keyword": {"type": "keyword"}}},"relation": {"type": "join","relations": {"parent": "child"}}}}
}

添加文档

  • 父文档
    POST /blog/_doc/1
    在这里插入图片描述

如果不指定relation会报错:
在这里插入图片描述

  • 子文档
    子文档的插入语法如下,注意routing是父文档的id,平时我们插入文档时routing的默认就是id。

POST /blog/_doc/1?routing=1
在这里插入图片描述

查询文档

父子查询方式,常用分为两种特殊情况:

  • 根据子文档查询父文档 has_parent
    例如我要查询王老五的留言:

POST /blog/_search

{"query": {"has_child": {"type": "comment","query": {"match": {"username": "王老五"}}}}
}

在这里插入图片描述

  • 根据父文档查询子文档 has_child
    例如我要查询文章内容包含“工具”的所有评论:

POST /blog/_search
在这里插入图片描述

聚合查询与嵌套文档类似,比较简单,这里在说明另外一种场景:祖辈和孙辈可以创建吗?比如本文中的留言如果它也有子文档,那么可以根据文章查询孙辈吗?答案是可以的,只需要在has_child里面在嵌套一层has_child查询即可。

http://www.lryc.cn/news/411196.html

相关文章:

  • 二百四十九、Linux——在Linux中创建新用户、赋予新用户root权限并对文件夹赋予新用户的权限
  • com.mysql.cj.jdbc.Driver 爆红
  • 传神论文中心|第19期人工智能领域论文推荐
  • 案例分享-国外轻松感UI设计赏析
  • 操作系统(4)——文件系统
  • C# 调用Webservice接口接受数据测试
  • 工作流流程引擎框架推荐来了
  • 从技术博客到个人 IP 矩阵:全面攻略与实战示例
  • SOFAJRaft 简介
  • c#中Oracle.DataAccess.dll连接数据库的报错处理
  • PyCharm2024 专业版激活设置中文
  • 视觉SLAM第一讲
  • 吴恩达机器学习C1W2Lab05-使用Scikit-Learn进行线性回归
  • springboot集成thymeleaf实战
  • SpringBoot+Vue+kkFileView实现文档管理(文档上传、下载、在线预览)
  • 从代码层面熟悉UniAD,开始学习了解端到端整体架构
  • 微信小程序-选中文本时选中checkbox
  • [玄机]流量特征分析-蚁剑流量分析
  • 2-51 基于matlab的IFP_FCM(Improved fuzzy partitions-FCM)
  • Java人力资源招聘社会校招类型招聘小程序
  • oracle表、表空间使用空间
  • IDEA管理远程仓库Git
  • 【数据结构】Java实现二叉搜索树
  • 钉钉小程序如何通过setdate重置对象
  • DjangoRF-10-过滤-django-filter
  • Android SurfaceFlinger——GraphicBuffer的生成(三十二)
  • <数据集>棉花识别数据集<目标检测>
  • [240730] OpenAI 推出基于规则的奖励机制 (RBR) 提升模型安全性 | 英特尔承认其13、14代 CPU 存在问题
  • 【JavaScript】展开运算符详解
  • 麒麟V10系统统一认证子系统国际化