当前位置: 首页 > news >正文

时序数据库之influxdb和倒排索引以及LSM-TREE

一、时序数据库的特点
1、时序数据库用作打点,用来做监控使用,属于写多读少的场景,而且由于时间不可逆,几乎不可能出现更新的操作。而且监控数据一般只会查询最近几分钟数据,冷热数据查询频率非常明显。因此非常贴合ES LSM-TREE这种准实时的特点。
2、ES和LSM-TREE 写入的时候,都是顺序写入,相比于mysql B+树因为需要维持全局有序,随机写。效率有很大提升。
3、而且ES和LSM-TREE都是批量写入,都会先在内存攒一批数据(ES是段写满,或者达到兜底时间。LSM-TREE是内存里memoryTable写满后)落入磁盘。写入效率相比于mysql高很多。
4、LSM-TREE分层SSTable(类似多级缓存),刚写入的数据在上层,历史数据经过SSTable合并后会落入下一层级(查询难度加大)。也非常适合时序数据库这种冷热明显的场景
5、但是由于LSM-TREE顺序写入,SSTable内部局部有序,因此对于查询功能不如mysql(B+树全局有序)。
6、但是LSM-TREE为了加快查询效率,每个SSTable有一个布隆过滤器,能够快速发现数据在不在此SSTable。最坏的情况,需要把所有SSTable的filter都判断一遍。
7、正是因为LAM-TREE局部有序。对于范围查询支持的不好。需要遍历所有SSTable查看范围,(SSTable内部可以二分查找)。最终多个SSTable查询结果进行合并
因此市面上的时序数据库通常都是采用LSM-TREE或其变种

二、influxdb的原理 以及与LSM-TREE的结合
1、概念
database ------> 数据库
measurment -----> 表
tag -----> 索引
field -----> 数据内容
series -----> 是存储数据的基本单位。measurment,tag完全相同,只有时间戳不同的数据会存到同一个series(方便对于某种特定数据进行时间范围查询)。相对的influxdb对于 tag数据内容多变的查询 支持的不好。
在这里插入图片描述
以序列的方式管理数据是时序数据库和传统关系型数据库最不同的地方。

2、双索引设计与高效查询思路(tag集合形成一个索引 时间戳是一个索引)
influxdb 查询先根据tag索引 查找到 某一条序列, 再根据时间索引进行 LSM-TREE查询

tag索引 是倒排索引 先根据倒排索引 查找序列(定位某一个LSM-TREE)
再根据时间 进行LSM-TREE查询

3、时序(序列)数据库致命问题:时间线膨胀
如果同一个measurment的tag集合变化太多,(tag1=x1,tag2=y1),(tag1=x2,tag2=y2)…等等。
就会造成序列太多,时序数据库的写入和读取性能通常都会有明显的下降。
因为序列太多,每次写数据,首先需要LSM-TREE查询写入哪条序列,SSTable局部有序,最坏情况需要遍历所有SSTable

http://www.lryc.cn/news/480911.html

相关文章:

  • 如何避免消息的重复消费问题?(消息消费时的幂等性)
  • 【Java SE】类与对象
  • 基于springboot的公益服务平台的设计与实现
  • Tomcat(6) 什么是Servlet容器?
  • 用js去除变量里的html标签
  • Vue3+element-plus摘要
  • Android Studio 将项目打包成apk文件
  • 贪心算法day2(最长递增子序列)
  • arcgis pro 学习笔记
  • OpenGL 进阶系列06 - OpenGL变换反馈(TransformFeedback)
  • elementUI 点击弹出时间 date-picker
  • 【浙江大学大模型系列】启真医疗大模型(国内大模型)
  • NestJS 项目中如何使用 class-validator 进行数据验证
  • 【AI抠图整合包及教程】Meta SAM2:引领图像和视频分割技术的新纪元
  • 小菜家教平台(三):基于SpringBoot+Vue打造一站式学习管理系统
  • ArcGIS/QGIS按掩膜提取或栅格裁剪后栅格数据的值为什么变了?
  • Linux的基本指令(一)
  • python导入包失败 in <module> import pandas as pd
  • 不惧风雨,硬核防护!雷孜LaCie小金刚三防移动硬盘颠覆认知
  • Yocto 项目下通过网络更新内核、设备树及模块
  • Scheduled Sampling工作原理【小白记笔记】
  • C++:C++的IO流
  • 「QT」几何数据类 之 QLine 整型直线类
  • day58 图论章节刷题Part09(dijkstra(堆优化版)、Bellman_ford 算法)
  • 【计网不挂科】计算机网络期末考试——【选择题&填空题&判断题&简述题】试卷(1)
  • 智能出行助手:SpringBoot共享汽车管理平台
  • 【月之暗面kimi-注册/登录安全分析报告】
  • Flink实现实时数据处理
  • 11.9.2024刷华为
  • Chromium 中chrome.system.storage扩展接口定义c++