当前位置: 首页 > news >正文

28.JavaWeb-Elasticsearch

1.Elasticsearch概述

        Elasticsearch 是一个分布式的全文检索引擎。采用Java语言开发,基于Apache协议的开源项目,具有实时搜索,稳定,可靠,快速的特点。

1.1 全文检索引擎

        分为通用搜索引擎(百度、谷歌)与站内搜索引擎,全文检索在处理非结构化文本数据方面非常有用

1.2 结构化数据与非结构化数据

        每个属性都有对应的字段的数据就是结构化数据,反之无法用二维表表述的数据就是非结构化数据

1.3 ES全文检索的原理

        Elasticsearch基于Lucene库构建而成,它使用了倒排索引的方式来实现全文检索。

1.3.1 倒排索引

        就是查找内容,根据内容得到内容所在文档

1.3.2 正排索引

        就是通过路径找到文档,再从文档找某段内容

2. ES安装

Elasticsearch:官方分布式搜索和分析引擎 | Elastic在 RESTful 风格的分布式免费开源搜索和分析引擎开源中,Elasticsearch 处于领先地位,速度快,可实现水平可扩展性和可靠性,并能让您轻松进行管理。免费启用。https://www.elastic.co/cn/elasticsearch/

2.1 启动ES

        双击 bin/elasticsearch.bat

TIPS:
启动后ES会占用两个端口。
9200:ES对外提供服务的端口
9300:ES进行集群间通信与数据传输的端口

2.2 修改ES的配置文件

elasticsearch-8.8.2\config\elasticsearch.yml

2.3 添加编码配置

elasticsearch-8.8.2\config\jvm.options 

2.4 打开浏览器访问

http://localhost:9200

 3.ES的使用

常见操作
新增索引PUT http://localhost:9200/job
查询索引中数据GET http://localhost:9200/job
删除索引DELETE http://localhost:9200/job
查询所有索引数据GET localhost:9200/_all
查询索引的摘要信息GET http://localhost:9200/_cat/indices?v
获取所有映射GET http://localhost:9200/_mapping

3.1 启用/关闭索引

POST http://localhost:9200/job/_close
POST http://localhost:9200/job/_open

3.2 ES的数据类型

类型说明示例
text当一个字段是要被全文搜索的,比如文章内容、产品描
述等使用text类型。
设置text类型以后,字段内容会被分析,在生成倒排索
引以前,字符串会被分一个一个词项。
比如:java软件工程师,
会被分词为 java 、 软
件 、 工程师
keywordkeyword类型适用于索引结构化的字段,如果字段需要
进行过滤、排序、聚合。keyword类型的字段只能通过
精确值搜索到。
比如:城市,我们搜索北
京、深圳,这类词不应该
被拆分。
date通过format设置日期格式,常见的可以设置成年月日时分秒、年月日及毫秒值三种格式。
ignore_malformed。默认值false。如果为true,则忽略格式错误的数字。如果为false(默认值),则格式错误的数字将引发异常并拒绝整个文档。
null_value。默认是null。接受采用配置格式之一的日期值作为该字段,以替换任何显式的空值。默认为null,这意味着该字段被视为丢失。
byte,short,integer,long整型比如:职位ID、薪水。
float, half_float, scaled_float,double浮点型
integer_range, long_range, float_range,double_range,date_range范围型

4.SpringBoot整合ES

        Spring Data是一个用于简化数据库访问,并支持云服务的开源框架。其主要目标是使得对数据的访问变得方便快捷。包括非关系数据库、Map-Reduce 框架、云数据服务、关系数据库的访问支持等。

        Spring Data ElasticSearch 基于 Spring Data API 简化 ElasticSearch操作,将原始操作ElasticSearch的客户端API 进行封装 。与ElastichSearch交互简化数据访问层开发。

4.1 导入依赖

        注意使用的JDK版本应与ES版本的兼容问题

<dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-data-elasticsearch</artifactId>
</dependency>

4.2 配置Elasticsearch连接信息

spring:elasticsearch:uris: http://localhost:9200

4.3 配置实体类

@Data
@Document(indexName = "esgoods") //indexName:索引的名称(必填项)
public class Goods {@Id  //主键的唯一标识private Integer id;//index:是否设置分词。searchAnalyze:搜索时使用的分词器。type: 数据类型@Field(index = true,type = FieldType.Text,searchAnalyzer = "ik_smart")private String name;private Integer stock;      // 库存@Field(type = FieldType.Text,searchAnalyzer = "ik_smart")private String description; // 描述
}
注解作用
@Document(indexName = "esgoods")用于指定该Java类映射到Elasticsearch中的索引名称。在这里,该类映射到名为"esgoods"的索引。
@Id用于标记文档的主键字段。在这里,id字段将被用作文档的主键。
@Field(index = true, type = FieldType.Text, searchAnalyzer = "ik_smart")用于配置类中的字段。在这里,name字段将被映射为Elasticsearch文档的一个字段,并且允许进行分词索引,使用的分词器是"ik_smart"。

4.4 编写Repository

        继承ElasticsearchRepository接口可以获得常用的数据操作方法

@Repository
public interface EsGoodsRepository extends ElasticsearchRepository<Goods,Integer> {Page<Goods> findByNameOrDescriptionOrderByIdDesc(String name, String description, Pageable pageable);
}

        ElasticsearchRepository接口是Spring Data Elasticsearch库提供的接口之一,它继承自Spring Data的CrudRepository接口,因此具备了常见的CRUD操作方法,如保存、查询、更新和删除等。

Spring Data Elasticsearch - Reference Documentationicon-default.png?t=N6B9https://docs.spring.io/spring-data/elasticsearch/docs/current/reference/html/#elasticsearch.repositories

4.5 实现方法

4.5.1 将数据库中数据导入ES

@Overridepublic int importAll() {List<Goods> goods = goodsMapper.selectAll();Iterable<Goods> iterable = goodsRepository.saveAll(goods);Iterator<Goods> iterator = iterable.iterator();int count = 0;while (iterator.hasNext()) {iterator.next();count++;}return count;}

4.5.2 实现搜索方法

@Overridepublic Page<Goods> search(String keyword, Integer pageNum, Integer pageSize) {return goodsRepository.findByNameOrDescriptionOrderByIdDesc(keyword,keyword,PageRequest.of(pageNum,pageSize));}
http://www.lryc.cn/news/95874.html

相关文章:

  • Python Flask构建微信小程序订餐系统 (十)
  • j2ee相关知识点
  • Shell脚本学习-eval内置命令
  • word中将合并后的多行拆分为原先的行数
  • 网络知识点之-BGP协议
  • 【mac系统】mac系统调整妙控鼠标速度
  • AI > 语音识别开源项目列举
  • golang单元测试及mock总结
  • mysql中的‘\G’ ‘\g’ ‘;’ navicat dbeaver
  • 驱动day4work
  • [SQL挖掘机] - 字符串函数 - length
  • 「深度学习之优化算法」(十七)灰狼算法
  • mysql主从复制(主-从-从)
  • 如何制定数据采集解决方案?
  • RabbitMQ消息可靠性问题及解决
  • 2023河南萌新联赛第(三)场:郑州大学(两个题目)
  • 学生管理系统-07打包与上线
  • day31贪心算法 用最少数量的箭引爆气球 和无重叠区间
  • AMEYA360报道:手机直连卫星通信发展的三个阶段
  • redis中缓存雪崩,缓存穿透,缓存击穿的原因以及解决方案
  • ChatGPT火热之下的冷思考
  • 查看docker容器启动参数
  • 对Webpack的理解
  • 使用wxPython和pillow开发拼图小游戏(四)
  • XGBoost实例——皮马印第安人糖尿病预测和特征筛选
  • 使用MQ发送对象错误
  • 安装和卸载docker,详细教程
  • RabbitMQ的确认机制
  • java项目之人才公寓管理系统(ssm+mysql+jsp)
  • git使用记录