当前位置: 首页 > news >正文

elasticsearch中的倒排索引

        倒排索引是搜索引擎中常用的一种数据结构,适用于全文检索,能够通过文本内容高效检索到相应的文档。

一、倒排索引的基本概念

正排索引:传统的索引方式,按照文档id顺序存储文档,通过文档id找到文档对应的词。因此当需要找到包含某个词的文档时,需要遍历所有文档,不适合全文检索。

doc_1cat dog
doc_2dog fish
doc_3cat fish

倒排索引:将文档中的每个词映射到包含该词的文档id列表,这样就可以快速找到包含某个词的所有文档。

cat[1, 3]
dog[1, 2]
fish[2, 3]

二、倒排索引优势

(1) 快速检索,避免全局扫描所有文档

(2)节省存储空间,倒排索引只存储词条与文档的关系,不会重复存储词条

(3)适合全文检索

三、elasticsearch中的倒排索引

        elasticsearch在实际应用中,还对倒排索引做了一系列优化,以提高性能和存储效率:

(1)压缩。倒排索引中的文档列表通常会进行压缩。

(2)分片与副本。通过分片(shard)和副本(replica)提高并发性和容错性。

(3)缓存机制。es会缓存热词。

http://www.lryc.cn/news/511868.html

相关文章:

  • 【Elasticsearch】DSL查询文档
  • 接口测试Day04-postman生成测试报告ihrm项目
  • 常见的排序算法过程和比较分析
  • 基于Vue+SSM+SpringCloudAlibaba书籍管理系统
  • 生成式 AI 增强了个人创造力,但减少了新内容的集体多样性
  • 【DC简介--Part1】
  • Spark写入HDFS数据SUCCESS文件生成控制
  • MySQL 服务器简介
  • 如何使用Python从SACS结构数据文件中提取节点数据信息并导出到EXCEL
  • Java网约车项目实战:实现抢单功能详解
  • SSRF服务端请求Gopher伪协议白盒测试
  • html+css+js网页设计 美食 家美食1个页面
  • 初学stm32---高级定时器输出n个pwm波
  • 旅游管理系统|Java|SSM|VUE| 前后端分离
  • imgproxy图像处理的高效与安全
  • LLM并行计算的论文
  • Linux 搭建 nginx+keepalived 高可用 | Nginx反向代理
  • Spring Boot 项目中 Maven 剔除无用 Jar 引用的最佳实践
  • useWhyDidYouUpdate详解
  • c++入门——c++输入cin和输出cout的简单使用
  • Spring Cloud LoadBalancer (负载均衡)
  • 微服务-1 认识微服务
  • 基于51单片机的交通灯带拐弯proteus仿真
  • 1229java面经
  • MySQL中查看表结构
  • python利用selenium实现大麦网抢票
  • FME教程:一键批量调换图斑X、Y坐标,解决因为坐标弄反了,导致GIS弹窗提示“范围不一致”警告问题
  • OpenCV-Python实战(4)——图像处理基础知识
  • 音视频入门基础:MPEG2-PS专题(1)——MPEG2-PS官方文档下载
  • Qt自定义步骤引导按钮