当前位置: 首页 > news >正文

LLM(大语言模型)常用评测指标-MAP@R

MAP@R (Mean Average Precision at R)

是一种用于评估信息检索系统或排序模型效果的评价指标。它特别适用于那些返回一组相关结果的情况,例如搜索引擎或推荐系统。这里的“R”代表返回的相关结果的数量。MAP@R 考虑了结果的排名和相关性两个因素。

计算方法

  1. 计算平均精度 (Average Precision, AP):对于每个查询,首先计算其精度(Precision)在不同截断级别(即不同数量的返回结果)的值,然后计算这些精度值的平均值。精度是指检索到的相关文档数量与检索到的总文档数量的比值。
  2. 计算平均精度的平均值 (Mean AP):对所有查询的平均精度(AP)进行平均。如果是MAP@R,那么在计算每个查询的AP时,只考虑前R个结果。

应用场景

MAP@R 通常用于评估搜索引擎、推荐系统、文本检索、图像检索等领域中的模型性能,特别是在关注顶部结果的精确性时。

计算实例

假设我们有一个搜索引擎,它针对两个不同的搜索查询返回了以下结果(这里的“相关”和“不相关”是基于某种标准预先定义的):

  • 查询 1:

    • 返回的结果:[相关, 不相关, 相关, 不相关, 相关]
    • R = 3(我们只考虑前3个结果)
  • 查询 2:

    • 返回的结果:[相关, 相关, 不相关, 相关, 不相关]
    • R = 3

步骤

  1. 计算每个查询的平均精度 (AP):
  • 对于查询 1,只看前3个结果:

    • 第一个相关结果的精度 = 1/1
    • 第二个相关结果的精度 = 2/3
    • 第三个相关结果(不在前3个结果中)不计算。
    • AP1 = (1/1 + 2/3) / 2 = 0.83
  • 对于查询 2,只看前3个结果:

    • 第一个相关结果的精度 = 1/1
    • 第二个相关结果的精度 = 2/2
    • 第三个相关结果(不在前3个结果中)不计算。
    • AP2 = (1/1 + 2/2) / 2 = 1.00
  1. 计算 MAP@R:
  • MAP@3 = (AP1 + AP2) / 2 = (0.83 + 1.00) / 2 = 0.915

因此,在这个例子中,MAP@3的值是0.915。这意味着在前3个返回结果中,模型在这两个查询上的平均表现接近于91.5%的准确率。请注意,在实际应用中,通常会对大量查询进行此类计算,以得到更为可靠的平均值。

http://www.lryc.cn/news/316858.html

相关文章:

  • 腾讯面经学习笔记
  • 北京某中厂凉经
  • 离线数仓(五)【数据仓库建模】
  • python | 类与对象
  • 基于Qt 和python 的自动升级功能
  • 【论文阅读】IEEE Access 2019 BadNets:评估深度神经网络的后门攻击
  • Unity 让角色动起来(动画控制器)
  • ubuntu22.04环境中安装pylint
  • 主流数据库的区别
  • veeam备份基础
  • Flink并行度
  • 这届留学生是懂作弊的,ChatGPT震惊教授一整年!
  • CVE-2023-38836 BoidCMSv.2.0.0 后台文件上传漏洞
  • pf4j插件实践验证
  • 计算机组成原理之运算方法和运算器
  • Redux Toolkit
  • 基于YOLOv8/YOLOv7/YOLOv6/YOLOv5的商品识别系统(深度学习+UI界面+训练数据集+Python代码)
  • 在亚马逊云EC2上启动PopOS
  • Linux运维:磁盘分区与挂载详解
  • jeecg 项目 springcloud 项目有一个模块 没加载进来 只需要 把这个模块放到 可以加载到模块的位置 刷新依赖
  • spring boot使用mybatisplus访问mysql的配置流程
  • git 如何将多个提交点合并为一个提交点 commit
  • [C语言] 数据存储
  • LoadBalancer负载均衡服务调用
  • YoloV8实战:YoloV8-World应用实战案例
  • Python 导入Excel三维坐标数据 生成三维曲面地形图(体) 5-1、线条平滑曲面且可通过面观察柱体变化(一)
  • cmake初识
  • Swift 入门学习:集合(Collection)类型趣谈-下
  • nova 12 LTPO来了!LTPO动态自适应刷新率屏120Hz体验更流畅 ,1Hz阅读更省电
  • 【rk3368 android6.0 恢复出厂设置功能】