当前位置: 首页 > news >正文

【HBZ分享】ES的评分score机制的原理

score类型

  1. 基础评分boost,默认2.2,
  2. 逆向文档频率值(IDF):表示该词再文档中(ES中)出现的次数越多,表示越不重要,评分越低
  3. 关键词在文档中出现的频率(TF):表示该词在文档中出现的频率,频率越高表示越重要,评分越高
    注意: IDF是出现次数越多,则评分越低, 而TF是出现次数越高,则评分越高,一正一反

score评分机制的计算

  1. boost × idf × tf
  2. 字段的权重 × 逆向文档频率的值 × 关键词在文档中出现的频率值

ES查询时带上评分计算

加上explain 和mysql查看索引使用情况是同一个词
GET /test_index/_search?explain=true

如何自定义评分机制

  1. 权重配置: 通过指定boost基础评分,来定制总评分, 查询请求如下,需要指定boost,来定制哪个词查询基础分更大,即相同频率下该次就会评分更高,会放在前面
GET /test_index/_search
{"query": {"bool": {"should": [{"match": {"summary": {"query": "boot", "boost": 1} // 指定查boot的基础评分boost = 1, 不指定boost则默认2.2}}, {"match": {"summary": {"query": "java", "boost": 3} // 指定查boot的基础评分boost = 3, 不指定boost则默认2.2}}, {"match": {"summary": {"query": "cloud", "boost": 1} // 指定查boot的基础评分boost = 1, 不指定boost则默认2.2}},{"match": {"summary": {"query": "spring", "boost": 1} // 指定查boot的基础评分boost = 1, 不指定boost则默认2.2}}, ]}}
}
  1. 公式定制化: ES提供了一些内置评分函数(BM25), 根据需要进行参数调整,或者使用自定义评分函数来实现
  2. 自定义评分插件
http://www.lryc.cn/news/126209.html

相关文章:

  • 函数递归专题(案例超详解一篇讲通透)
  • leetcode-413. 等差数列划分(java)
  • 从零开始学习 Java:简单易懂的入门指南之MAth、System(十二)
  • 人工智能原理概述 - ChatGPT 背后的故事
  • 【Linux】以太网协议——数据链路层
  • Neo4j之MATCH基础
  • Python实验代码合集
  • Less和Sass的原理和用法
  • c# List<T>.Aggregate
  • 软件测试常用工具总结(测试管理、单元测试、接口测试、自动化测试、性能测试、负载测试等)
  • Hadoop组件
  • jeecg-boot批量导入问题注意事项
  • Django图书商城系统实战开发 - 实现会员管理
  • Kafka如何解决消息丢失的问题
  • 我只记得512天在CSDN的日子
  • pycharm,VSCode 几个好用的插件
  • springboot 使用zookeeper实现分布式ID
  • git cherry-pick
  • 转行软件测试四个月学习,第一次面试经过分享
  • ECS服务器安装docker
  • 高等数学教材啃书汇总重难点(三)微分中值定理与导数的应用
  • 域名列表是什么?
  • 数据库操作不再困难,MyBatis动态Sql标签解析
  • Android 网络编程-网络请求
  • Mac下全选,使用pynput,怎样调用command键?
  • 21款美规奔驰GLS450更换中规高配主机,汉化操作更简单
  • R语言ggplot2 | R语言绘制物种组成面积图(三)
  • 数据统计与可视化的Dash应用程序
  • 解决并发冲突:Java实现MySQL数据锁定策略
  • C++——函数重载及底层原理