当前位置：首页 > news >正文

LLM(大语言模型)常用评测指标-MAP@R

news 2025/9/18 8:21:52

MAP@R (Mean Average Precision at R)

是一种用于评估信息检索系统或排序模型效果的评价指标。它特别适用于那些返回一组相关结果的情况，例如搜索引擎或推荐系统。这里的“R”代表返回的相关结果的数量。MAP@R 考虑了结果的排名和相关性两个因素。

计算方法

计算平均精度 (Average Precision, AP)：对于每个查询，首先计算其精度（Precision）在不同截断级别（即不同数量的返回结果）的值，然后计算这些精度值的平均值。精度是指检索到的相关文档数量与检索到的总文档数量的比值。
计算平均精度的平均值 (Mean AP)：对所有查询的平均精度（AP）进行平均。如果是MAP@R，那么在计算每个查询的AP时，只考虑前R个结果。

应用场景

MAP@R 通常用于评估搜索引擎、推荐系统、文本检索、图像检索等领域中的模型性能，特别是在关注顶部结果的精确性时。

计算实例

假设我们有一个搜索引擎，它针对两个不同的搜索查询返回了以下结果（这里的“相关”和“不相关”是基于某种标准预先定义的）：

查询 1:
- 返回的结果：[相关, 不相关, 相关, 不相关, 相关]
- R = 3（我们只考虑前3个结果）
查询 2:
- 返回的结果：[相关, 相关, 不相关, 相关, 不相关]
- R = 3

步骤

计算每个查询的平均精度 (AP):

对于查询 1，只看前3个结果：
- 第一个相关结果的精度 = 1/1
- 第二个相关结果的精度 = 2/3
- 第三个相关结果（不在前3个结果中）不计算。
- AP1 = (1/1 + 2/3) / 2 = 0.83
对于查询 2，只看前3个结果：
- 第一个相关结果的精度 = 1/1
- 第二个相关结果的精度 = 2/2
- 第三个相关结果（不在前3个结果中）不计算。
- AP2 = (1/1 + 2/2) / 2 = 1.00

计算 MAP@R:

MAP@3 = (AP1 + AP2) / 2 = (0.83 + 1.00) / 2 = 0.915

因此，在这个例子中，MAP@3的值是0.915。这意味着在前3个返回结果中，模型在这两个查询上的平均表现接近于91.5%的准确率。请注意，在实际应用中，通常会对大量查询进行此类计算，以得到更为可靠的平均值。

http://www.lryc.cn/news/316858.html

相关文章：

腾讯面经学习笔记

北京某中厂凉经

离线数仓（五）【数据仓库建模】

python | 类与对象

基于Qt 和python 的自动升级功能

【论文阅读】IEEE Access 2019 BadNets:评估深度神经网络的后门攻击

Unity 让角色动起来（动画控制器）

ubuntu22.04环境中安装pylint

主流数据库的区别

veeam备份基础

这届留学生是懂作弊的，ChatGPT震惊教授一整年！

CVE-2023-38836 BoidCMSv.2.0.0 后台文件上传漏洞

pf4j插件实践验证

计算机组成原理之运算方法和运算器

基于YOLOv8/YOLOv7/YOLOv6/YOLOv5的商品识别系统（深度学习+UI界面+训练数据集+Python代码）

在亚马逊云EC2上启动PopOS

Linux运维：磁盘分区与挂载详解

jeecg 项目 springcloud 项目有一个模块没加载进来只需要把这个模块放到可以加载到模块的位置刷新依赖

spring boot使用mybatisplus访问mysql的配置流程

git 如何将多个提交点合并为一个提交点 commit

[C语言] 数据存储

LoadBalancer负载均衡服务调用

YoloV8实战：YoloV8-World应用实战案例

Python 导入Excel三维坐标数据生成三维曲面地形图(体) 5-1、线条平滑曲面且可通过面观察柱体变化(一)

Swift 入门学习：集合（Collection）类型趣谈-下

nova 12 LTPO来了！LTPO动态自适应刷新率屏120Hz体验更流畅，1Hz阅读更省电

【rk3368 android6.0 恢复出厂设置功能】