当前位置: 首页 > news >正文

一文了解Elasticsearch

数据分类

数据按数据结构分类主要有三种:结构化数据半结构化数据非结构化数据

结构化数据

结构化数据具有明确定义数据模型和格式的数据类型

图片

特点:

  • 数据具有固定的结构和模式。

  • 数据项明确定义数据类型和长度。

  • 适合用于数据查询、过滤和分析、存储。

半结构化数据

半结构化数据介于结构化和非结构化数据之间。它具有一定的结构信息,但没有结构化数据那么明确

图片

特点:

  • 数据元素包含在文档中,并且具有层次结构。

  • 使用标记或标签来标识数据元素。

  • 具有更大的灵活性,能够适应不同的数据模型。

非结构化数据

非结构化数据不具备明确结构的数据

图片

特点:

  • 数据没有明确的结构,不容易进行数据分析。

  • 数据可能包含大量的自由文本和非关联的信息。

  • 难以用传统数据库或查询语言来处理。

Elasticsearch简介

Elasticsearch(简称ES), 既是一个面向文档的 NoSQL 数据库,又是一个开源的高扩展的分布式全文检索引擎

图片

ES扩展性好,可以扩展到上百台服务器,处理起PB级数据时,能到秒级搜索,近乎实时搜索。

在开源全文检索领域,ES在DB-Engines搜索引擎类别长年霸榜!!!

图片

国内有很多大厂都在使用Elasticsearch,比如阿里巴巴、京东、腾讯、美团、头条、携程、滴滴等。

ES基于Java语言进行开发,以 Lucene 为基础建立的全文搜索引起,通过简单的 RESTful API来隐藏Lucene的复杂性,从而让全文搜索变得简单。

「什么是Lucene?」
Lucene是一个开源的高性能的全文检索库,由Java语言开发,具有高效性、可伸缩性的特点。
Lucene 最初是由 Doug Cutting 创建,并于2001年成为 Apache软件基金会的一个子项目。
Lucene 能实现全文搜索主要是因为它实现了倒排索引的查询结构。

ES分词使用的是倒排索引。ES自带的分词器默认根据空格进行分词

图片

如果文章是中文的话,建议采用插件IK中文分词器实现中文内容的分词

Elasticsearch使用场景

  • 日志分析和监控:ES可以收集、存储和分析大量服务器日志数据,监控系统性能和查找故障。

  • 搜索引擎:ES可以构建高性能的搜索引擎,用于查询大量文档、网页和其他数据。

  • 商业智能和数据分析:ES可以用于处理和分析大量实时数据,以帮助企业做出更明智的决策。

  • 安全性分析:ES可以用于收集、存储和分析安全日志数据,帮助您检测安全事件和预防攻击。

  • 互联网中间件:ES可以作为互联网应用程序的中间件,用于处理大量动态

http://www.lryc.cn/news/212937.html

相关文章:

  • 一篇文章认识【性能测试】
  • linux环境mysql安装配置踩坑
  • 相关性网络图 | 热图中添加显著性
  • cocosCreator 之 微信小游戏授权设置和调用wxAPI获取用户信息
  • element ui el-table表格纵向横向滚动条去除并隐藏空白占位列
  • 防止python进程重复执行
  • LV.12 D13 C工程与寄存器封装 学习笔记
  • Java SE 学习笔记(十九)—— XML、设计模式
  • grafana InfluxDB returned error: error reading influxDB 400错误解决
  • 【LeetCode:150. 逆波兰表达式求值 | 栈】
  • 什么是神经网络,它的原理是啥?(2)
  • leetcode做题笔记206. 反转链表
  • 2023/10/31 JAVA学习
  • SurfaceFliger绘制流程
  • 系统架构设计师-第14章-云原生架构设计理论与实践-
  • conda 实践
  • 行业追踪,2023-10-31
  • springboot 配置多个Redis数据源详解
  • 【数据结构】排序算法总结
  • 作为20年老程序员,我如何使用GPT4来帮我写代码
  • 【机器学习合集】模型设计之残差网络 ->(个人学习记录笔记)
  • GoLong的学习之路(十六)基础工具之Gin框架
  • VMware打开centos黑屏解决方法汇总
  • 5G物联网关相较有线网关有哪些独特优势
  • 【数据结构】顺序表的学习
  • 在NISQ小型计算机上执行大型并行量子计算的可能性
  • 考虑时空相关性的风电功率预测误差MATLAB代码
  • ASP.NET WebApi 极简依赖注入
  • 解决proteus仿真stm32,IIC通讯,IIC DEBUG无法显示从机应答信号的问题(问题情况为在8位数据后应答位显示?)
  • PHP判断闰年