当前位置: 首页 > news >正文

【ES】es介绍

倒排索引(Inverted Index)和正排索引(Forward Index)

正排索引是一种以文档为单位的索引结构,它将文档中的每个单词或词组与其所在的文档进行映射关系的建立。正排索引通常用于快速检索指定文档的内容,可以根据文档的编号或其他标识符快速定位到文档的内容。

倒排索引是一种以单词或词组为单位的索引结构,它将每个单词或词组与包含该单词或词组的文档进行映射关系的建立。倒排索引通常用于根据关键词进行文档的检索,可以根据关键词快速找到包含该关键词的文档列表。

正排索引和倒排索引的主要区别在于索引结构的建立方式和使用场景。正排索引适用于需要快速定位到指定文档的场景,而倒排索引适用于根据关键词进行文档的检索和查询的场景。

下面是正排索引和倒排索引的示意图:

正排索引示意图:

文档1 -> 单词1, 单词2, ...
文档2 -> 单词3, 单词4, ...
文档3 -> 单词2, 单词5, ...

倒排索引示意图:

单词1 -> 文档1
单词2 -> 文档1, 文档3
单词3 -> 文档2
单词4 -> 文档2
单词5 -> 文档3

总的来说,正排索引和倒排索引是信息检索中常用的两种索引结构,它们在索引和搜索过程中发挥着不同的作用,对于不同的应用场景有着不同的优势。

正常情况下我们将Id设置为主键索引能够快速查询到某条记录,但是有些字段不方便创建索引,如名称,简介等字段。

在这里插入图片描述

  1. es和MySQL对比
    在这里插入图片描述
    分词器
    安装完IK分词器后有两个常用的分词模式ik_max_wordik_smart

ik_max_word 分词会分的更细。
ik_smart 发现一个词后就不会再对分过的词进行重新分词
程序员 使用ik_max_word分词。会分为程序员程序 三个词
而使用ik_smart的话,则就分一个 程序员 一个词
各有优缺点

在这里插入图片描述

配置IK分词器的扩展字典,及禁用字典 在这里插入图片描述
在这里插入图片描述

IK分词器的总结

在这里插入图片描述

mapping映射

在这里插入图片描述

http://www.lryc.cn/news/268729.html

相关文章:

  • 07.kubernetes客户端部署
  • laravel5.8中实现验证码组件的安装和验证
  • 使用VScode通过内网穿透在公网环境下远程连接进行开发
  • 常用的 linux 命令
  • [论文阅读笔记28] 对比学习在多目标跟踪中的应用
  • Ubuntu 下播放语音提示
  • ubuntu 用户管理
  • 轻舟已过万重山,鸿蒙4.0程序员危机
  • 【Pytorch】学习记录分享6——PyTorch经典网络 ResNet与手写体识别
  • Flink1.17实战教程(第三篇:时间和窗口)
  • CSS 纵向扩展动画
  • Android 12 Token 机制
  • TCP与UDP是流式传输协议吗?
  • 61 贪心算法解救生艇问题
  • C#高级 01.Net多线程
  • Java---泛型讲解
  • 【论文阅读笔记】SegVol: Universal and Interactive Volumetric Medical Image Segmentation
  • Unix/Linux操作系统介绍
  • 什么是https证书?
  • C++ DAY2作业
  • RabbitMQ核心概念记录
  • 算法时间空间复杂度计算—空间复杂度
  • 计算机专业校招常见面试题目总结
  • 网络编程『简易TCP网络程序』
  • java itext5 生成PDF并填充数据导出
  • 如何配置TLSv1.2版本的ssl
  • 在CentOS 7上使用普通用户`minio`安装和配置MinIO
  • Vue3-27-路由-路径参数的简单使用
  • w7数据库基础之mysql函数
  • 智能优化算法应用:基于人工蜂鸟算法3D无线传感器网络(WSN)覆盖优化 - 附代码