当前位置: 首页 > news >正文

Meta KDD Cup 2024 CRAG: Comphrehensive RAG Benchmark参赛指南(写了一半跑去改大论文了所以没正式参赛)

诸神缄默不语-个人CSDN博文目录

因为比赛过程正好和我毕业答辩的时间段高度重合,所以我……最后其实还是相当于没有成功参赛。
呃反正现在已经咕咕咕了,就把当时写了一半(一小半)的参赛指南发一下吧。

官网:AIcrowd | Meta Comprehensive RAG Benchmark: KDD Cup 2024 | Challenges

注册一个AIcrowd账号就可以参赛,参赛后可以组队。现在(2024.5.21)已经进入Round 1b阶段了,在Round 1阶段有有效提交的队伍就可以进入Round 2阶段。

每周限制提交10次(每个任务)。

一共是3个任务,任务一是提供5个离线网站做RAG,任务二在任务一的基础上增加了一个KG API,任务三在任务二的基础上将离线网站提升为50个。
数据奇难无比。

官方baseline:https://gitlab.aicrowd.com/aicrowd/challenges/meta-comprehensive-rag-benchmark-kdd-cup-2024/meta-comphrehensive-rag-benchmark-starter-kit/-/blob/master/docs/baselines.md

如何开始提交:

  1. fork https://gitlab.aicrowd.com/aicrowd/challenges/meta-comprehensive-rag-benchmark-kdd-cup-2024/meta-comphrehensive-rag-benchmark-starter-kit
  2. 将forked repo克隆到本地,开始开发
    1. 添加SSH key到AIcrowd GitLab:https://gitlab.aicrowd.com/-/profile/keys
    2. 克隆:
      git clone git@gitlab.aicrowd.com:<YOUR-AICROWD-USERNAME>/meta-comphrehensive-rag-benchmark-starter-kit.git
      cd meta-comphrehensive-rag-benchmark-starter-kit
      

我的策略基本上就是用LLaMA3-7B了,主要因为80B那个版本没法微调,其次也因为我队友已经下好了8B的weights所以我直接用就行。

1. 任务一

https://www.aicrowd.com/challenges/meta-comprehensive-rag-benchmark-kdd-cup-2024/problems/meta-kdd-cup-24-crag-retrieval-summarization

baseline:DummyModel 全部输出“我不知道”

得分:{‘score’: 0.0, ‘exact_accuracy’: 0.0, ‘accuracy’: 0.0, ‘hallucination’: 0.0, ‘missing’: 1.0, ‘n_miss’: 10, ‘n_correct’: 0, ‘n_correct_exact’: 0, ‘total’: 10}

baseline:vanilla LLaMA3直接输出问题的答案

得分:{‘score’: -0.4, ‘exact_accuracy’: 0.0, ‘accuracy’: 0.2, ‘hallucination’: 0.6, ‘missing’: 0.2, ‘n_miss’: 2, ‘n_correct’: 2, ‘n_correct_exact’: 0, ‘total’: 10}

http://www.lryc.cn/news/403782.html

相关文章:

  • 系统架构设计师教程 第3章 信息系统基础知识-3.7 企业资源规划(ERP)-解读
  • windows实现自动化按键
  • 阿里云 https证书部署
  • DX-10A信号继电器 柜内安装,板前接线 约瑟JOSEF
  • 芯片光刻后的晶片多层组合构成的吗
  • OpenGL-ES 学习(7) ---- VBO EBO 和 VAO
  • github如何实现和gitlab的同步
  • 内网隧道——隧道技术基础
  • NAS新品“翻车”后,绿联科技要上市了
  • kafka-client如何打印连接日志
  • 1、springboot3 vue3开发平台-后端-项目构建
  • 修改了mybatis的xml中的sql不重启服务器如何动态加载更新
  • Intel和AMD用户再等等!微软确认Win11 24H2年底前登陆
  • Web开发:图片九宫格与非九宫格动态切换效果(HTML、CSS、JavaScript)
  • 价格较低,功能最强?OpenAI 推出 GPT-4o mini,一个更小、更便宜的人工智能模型
  • 【学习笔记】无人机系统(UAS)的连接、识别和跟踪(八)-无人机探测与避让(DAA)机制
  • 网络结构-组件-AI(九)
  • 弹性网络回归(Elastic Net Regression)
  • 【深度学习】FaceChain-SuDe,免训练,AI换脸
  • Uniapp鸿蒙项目实战
  • 计算机三级嵌入式笔记(一)—— 嵌入式系统概论
  • react Jsx基础概念和本质
  • 【深大计算机系统(2)】实验一 实验环境配置与使用 附常用指令
  • 目标检测经典模型之YOLOV5-detect.py源码解析(持续更新)
  • PF4J+SpringBoot
  • 设计模式11-原型模式
  • Tomcat长连接源码解析
  • C++编程:实现一个跨平台安全的定时器Timer模块
  • PyTorch的自动微分模块【含梯度基本数学原理详解】
  • AI 绘画|Midjourney设计Logo提示词