当前位置: 首页 > news >正文

es7.x es的高亮与solr高亮查询的对比对比说明

一  solr&es高亮

1.1 solr与es高亮功能

解释说明:

1)高亮配置:

fragmentSize(1000) 设置片段长度

numOfFragments(1) 指定返回的片段数量

preTags() 和 postTags() 设置高亮标记

2)字段处理差异:

在 ES 中,使用 matchQuery 而非 termQuery 进行内容查询,因为:

matchQuery 会分析查询文本,更适合高亮

termQuery 用于精确匹配,不适合片段提取

3)得分处理:

explain(true) 使返回结果包含评分信息

通过 hit.getScore() 获取文档相关性得分

4)高亮结果提取:获取第一个高亮片段的内容

hit.getHighlightFields().get("content").fragments()[0].string()

https://chat.deepseek.com/a/chat/s/cfd96216-b726-4e00-9e9b-a74afa0d1c7f

1.2 es高亮功能代码

1代码

在 Elasticsearch 中实现与 Solr 高亮代码相同功能的 Java 代码如下。这段代码实现了相同的功能:分页查询、返回所有字段和得分、对指定字段进行高亮并返回指定数量的片段:

import org.elasticsearch.action.search.SearchRequest;

import org.elasticsearch.action.search.SearchResponse;

import org.elasticsearch.client.RequestOptions;

import org.elasticsearch.client.RestHighLevelClient;

import org.elasticsearch.common.unit.TimeValue;

import org.elasticsearch.index.query.BoolQueryBuilder;

import org.elasticsearch.index.query.QueryBuilders;

import org.elasticsearch.search.SearchHit;

import org.elasticsearch.search.builder.SearchSourceBuilder;

import org.elasticsearch.search.fetch.subphase.highlight.HighlightBuilder;

import org.elasticsearch.search.sort.ScoreSortBuilder;

import org.elasticsearch.search.sort.SortOrder;

import java.util.Map;

// 1. 构建查询条件(使用之前的查询)

BoolQueryBuilder boolQuery = QueryBuilders.boolQuery()

    .must(QueryBuilders.termQuery("title.keyword", retrievalRequest.getCollectionName()))

    .must(QueryBuilders.matchQuery("content", keyword)); // 使用matchQuery而非termQuery以支持高亮

// 2. 创建搜索源构建器

SearchSourceBuilder sourceBuilder = new SearchSourceBuilder()

    .query(boolQuery)

    .from((pageRequest.getPageNumber() - 1) * pageRequest.getPageSize()) // 分页起始位置

    .size(pageRequest.getPageSize()) // 每页大小

    .fetchSource("*", null) // 返回所有字段,相当于Solr的addProjectionOnField(Field.of("*"))

    .explain(true); // 返回得分,相当于Solr的addProjectionOnField(Field.of("score"))

// 3. 构建高亮设置

HighlightBuilder highlightBuilder = new HighlightBuilder()

    .field(new HighlightBuilder.Field("content") // 要高亮的字段

        .fragmentSize(1000) // 高亮片段长度

        .numOfFragments(1) // 返回的片段数量

        .preTags("<span style='color:red'>") // 高亮前缀

        .postTags("</span>")) // 高亮后缀

    .requireFieldMatch(true); // 只高亮匹配字段

// 4. 添加到搜索源

sourceBuilder.highlighter(highlightBuilder);

// 5. 创建搜索请求

SearchRequest searchRequest = new SearchRequest("your_index_name"); // 对应Solr的"coll"

searchRequest.source(sourceBuilder);

// 6. 执行查询

SearchResponse response = client.search(searchRequest, RequestOptions.DEFAULT);

// 7. 处理结果

for (SearchHit hit : response.getHits().getHits()) {

    // 获取原始字段

    Map<String, Object> sourceAsMap = hit.getSourceAsMap();

    

    // 获取高亮内容

    if (hit.getHighlightFields().containsKey("content")) {

        String highlightedContent = hit.getHighlightFields().get("content").fragments()[0].string();

        // 将高亮内容设置到返回对象中

    }

    

    // 获取得分

    float score = hit.getScore();

}

http://www.lryc.cn/news/625681.html

相关文章:

  • 使用Tomcat Clustering和Redis Session Manager实现Session共享
  • Auto-CoT:大型语言模型的自动化思维链提示技术
  • 基于“R语言+遥感“水环境综合评价方法技术应用——水线提取、水深提取、水温提、水质提取、水环境遥感等
  • STM32-FreeRTOS快速入门指南(下)
  • LLM 中 token 简介与 bert 实操解读
  • 字符串与算法题详解:最长回文子串、IP 地址转换、字符串排序、蛇形矩阵与字符串加密
  • 基于SpringBoot+Vue的写真馆预约管理系统(邮箱通知、WebSocket及时通讯、协同过滤算法)
  • ProfiNet从站转Modbus TCP网关技术详解
  • Ubuntu Server 22.04 k8s部署服务较时,文件描述符超过限制的处理方法
  • 算法训练营day55 图论⑤ 并查集理论基础、107. 寻找存在的路径
  • 游戏相机震动与武器后坐力实现指南
  • ReLens「Focus DSLR 大光圈虚化相机」v4.1.2 f 解锁付款版 —一款专业大光圈和单反级背景虚化编辑软件
  • 基于 RxJava 构建强大的 Android 文件下载管理器
  • Linux管道
  • 云原生俱乐部-shell知识点归纳(1)
  • Codeforces 斐波那契立方体
  • DaemonSet控制器
  • 《Java 多线程全面解析:从基础到生产者消费者模型》
  • SpringClound——网关、服务保护和分布式事务
  • 编排之神--Kubernetes中的认证授权详解
  • 无训练神经网络影响下的智能制造
  • 论文阅读:Prompt Optimization in Large Language Models
  • 基于SpringBoot的篮球馆预约管理系统【2026最新】
  • iOS 性能监控实践,如何构建从开发到运维的持续优化体系
  • 基于prompt的生物信息学:多组学分析的新界面
  • 在linux系统中下载Andconda
  • 基于正则的Java的IP地址格式校验(ipv4 ipv6)
  • PythonDay31
  • Kubernetes集群安装部署--flannel
  • 【Langchain系列七】Langchain+FastAPI(字符串输出与OpenAI规范流式输出)+FastGPT