当前位置: 首页 > news >正文

es快速扫描

介绍

Elasticsearch简称es,一款开源的分布式全文检索引擎
可组建一套上百台的服务器集群,处理PB级别数据
可满足近实时的存储和检索

倒排索引

跟正排索引相对,正排索引是根据id进行索引,所以查询效率非常高,但是模糊查询效率低,因为要全表扫描,即便创建索引也不生效
倒排索引是先根据查询内容进行分词处理,根据每个词条创建索引,还会存储该词条出现的所有记录id,这样即使模糊查询也会命中索引,从而找到所有包含搜索项的记录id,再进行处理返回结果

如果选举master

对所有配置可以成为master的节点根据nodeId进行排序,默认排第一位的节点是master,所有分片都进行如此操作,最后票数达到半数以上的节点成为master节点

如何避免脑裂

可以配置最小master节点数参数来解决脑裂问题

写入原理

首先会根据docid进行hash找到合适的分片
然后开始写入,分两个阶段,refresh和flush阶段
refresh阶段:先将数据写到内存buffer中,然后每秒将数据向os cache中写入,生成新的segment,os cache中的数据可以进行查询
flush阶段:写入到os cache中的translog数据,默认每5秒刷盘一次,当translog足够大(512M)或者 每30分钟进行一次flush操作,将translog中所有内容全部刷盘,旧的translog将被删除

针对大数据如何进行聚合操作

使用elasticsearch提供的cardinality度量,它提供一个字段的基数,也就是该字段的distinct或者unique数目

如何保证读写一致性

使用版本号乐观并发控制

http://www.lryc.cn/news/508896.html

相关文章:

  • 前端对页面数据进行缓存
  • leetCode322.零钱兑换
  • jsp-servlet开发
  • 从零玩转CanMV-K230(7)-I2C例程
  • n阶Legendre多项式正交性的证明
  • HarmonyOS NEXT - Dialog 和完全自定义弹框
  • 内容与资讯API优质清单
  • 开源 JS PDF 库比较
  • AnaPico信号源在通信测试中的应用案例
  • 《智启新材:人工智能重塑分子结构设计蓝图》
  • 进阶岛-L2G5000
  • 单点登录平台Casdoor搭建与使用,集成gitlab同步创建删除账号
  • PaddlePaddle飞桨Linux系统Docker版安装
  • 一款基于.NET开发的简易高效的文件转换器
  • Spring Boot教程之三十一:入门 Web
  • 青少年编程与数学 02-004 Go语言Web编程 20课题、单元测试
  • 概率论 期末 笔记
  • Typesense:开源的高速搜索引擎
  • 【vue】圆环呼吸灯闪烁效果(模拟扭蛋机出口处灯光)
  • 飞牛 fnos 使用docker部署 Watchtower 自动更新 Docker 容器
  • 《信管通低代码信息管理系统开发平台》Linux环境安装说明
  • 基于物联网的车辆定位和防盗报警系统(论文+源码)
  • 京东零售数据可视化平台产品实践与思考
  • Vue中使用a标签下载静态资源文件(比如excel、pdf等),纯前端操作
  • ensp 基于EASY IP的公司出口链路配置
  • 方正畅享全媒体采编系统reportCenter.do接口SQL注入漏洞复现 [附POC]
  • 零知识证明:区块链隐私保护的变革力量
  • 解决:el-select可输入时失焦会失去输入框中值
  • ollama-webui - Ollama的ChatGPT 风格的 Web 界面
  • 「下载」智慧产业园区-数字孪生建设解决方案:重构产业全景图,打造虚实结合的园区数字化底座