当前位置: 首页 > news >正文

一些指标的学习

1.平均倒数排名(MRR)

1.定义
MRR 是衡量检索系统返回的结果列表中第一个相关结果位置的指标。具体来说,它是所有查询倒数排名的平均值。
2.计算步骤

  1. 对每个查询,找到第一个正确答案在结果列表中的排名 𝑅𝑎𝑛𝑘。
  2. 计算该排名的倒数 1/Rank​。
  3. 对所有查询的倒数求平均。
    3.例子
    Query1: 查询关键词:“Python 编程教程”
    结果列表:
Python 基础教程 - 正确
Java 编程指南
数据科学概述
Python 进阶教程

在这个查询中,第一个正确答案 (“Python 基础教程”) 在结果列表的第1个位置,所以排名是1。

Query2: 查询关键词:“机器学习基础”
结果列表:

数据分析工具
深度学习简介
机器学习概述 - 正确
统计学入门

在这个查询中,第一个正确答案 (“机器学习概述”) 在结果列表的第3个位置,所以排名是3。
因此,当我们说查询结果排名分别是1、3,这意味着:

  • 第一个查询的正确答案在第1个位置。
  • 第二个查询的正确答案在第3个位置。
    根据这些排名,我们可以计算 MRR为1+1/3≈1.33。

4.作用:
MRR 能反映系统多快能找到正确答案,数值越高表示系统越有效。

2.recall@K

1.定义:
recall@K 是用于评估系统在前 K 个检索结果中找到相关项目的能力的指标。
2.计算步骤:

  1. 每个查询,检查前 K 个结果中是否包含至少一个相关项目
  2. 计算包含相关项目的查询比例。

3.例子:
在这里插入图片描述
在这个例子中,有 8 个查询在前 5 个结果中找到了相关项目(查询1、查询3、查询4、查询5、查询7、查询8、查询9、查询10)。因此recall@5=8/10=0.8。

4.公式:
Recall@K= Total number of relevant documents / Number of relevant documents in top K results
5.结果:
recall@K 评估系统在给定结果数量内找到相关信息的可能性,数值越高表示系统在较短结果列表中找到正确答案的能力越强。

3.NDCG@K

http://www.lryc.cn/news/387298.html

相关文章:

  • dledger原理源码分析系列(三)-选主
  • 如何修改PDF文档的作者名称?
  • 从笔灵到AI去痕:全方位提升内容创作与学术诚信
  • 考试如果出现汉诺塔问题怎么办?
  • 导出word模板开发记录
  • PHP爬虫类的并发与多线程处理技巧
  • 用Python将PowerPoint演示文稿转换到图片和SVG
  • 机电公司管理小程序的设计
  • SQL中的子查询和CTE(with ....as..)
  • Cesium 基本概念:创建实体和相机控制
  • vue使用scrollreveal和animejs实现页面滑动到指定位置后再开始执行动画效果
  • 在Ubuntu 16.04上安装和配置GitLab的方法
  • STM32的SPI通信
  • 机器学习引领教育革命:智能教育的新时代
  • 6月29日,每日信息差
  • SpringCloud中复制模块然后粘贴,文件图标缺少蓝色方块
  • JS乌龟吃鸡游戏
  • 第十节:学习ConfigurationProperties类来配置pojo实体类参数(自学Spring boot 3.x的第二天)
  • 如何学习Node.js
  • 云计算基础知识
  • 基于单片机光纤测距系统的设计与实现
  • python项目实战——人生重开模拟器
  • 小时候的子弹击中了现在的我-hive进阶:案例解析(第18天)
  • 电影票房预测管理系统设计
  • 正则表达式与Pyhton
  • Transformer常见面试题
  • Linux——vim的配置文件+异常处理
  • node mySql 实现数据的导入导出,以及导入批量插入的sql语句
  • Webpack: 底层配置逻辑
  • 数字图像处理期末复习题1