当前位置: 首页 > news >正文

【AIGC评测体系】大模型评测指标集

大模型评测指标集

    • (☆)SuperCLUE
    • (1)SuperCLUE-V(中文原生多模态理解测评基准)
    • (2)SuperCLUE-Auto(汽车大模型测评基准)
    • (3)AIGVBench-T2V(文生视频基准测评)
    • (4)SuperCLUE-Coder(代码助手测评基准)
    • (5)SuperCLUE-RAG(中文原生检索增强生成测评基准)
    • (6)SuperCLUE-Agent(Agent能力测评基准)
    • (7)SuperCLUE-Image(中文原生文生图测评基准)

(☆)SuperCLUE

  • CLUE官网: https://www.CLUEBenchmarks.com
  • SuperCLUE排行榜网站: https://www.superclueai.com
  • Github地址: https://github.com/CLUEbenchmark/SuperCLUE
Panda

(1)SuperCLUE-V(中文原生多模态理解测评基准)

  • 推荐文章: SuperCLUE-V: 中文原生多模态理解测评基准
  • 项目地址: https://github.com/CLUEbenchmark/SuperCLUE-V
Panda

(2)SuperCLUE-Auto(汽车大模型测评基准)

  • 推荐文章: SuperCLUE-Auto:首个汽车行业中文大模型测评基准发布
  • 项目地址: https://github.com/CLUEbenchmark/SuperCLUE-auto
Panda

(3)AIGVBench-T2V(文生视频基准测评)

  • 推荐文章: AIGVBench文生视频测评首期结果公布,1000个AI视频对比,最高72.9分,Luma仅第3
  • AIGVBench登录页: www.AIGVBench.com
Panda

(4)SuperCLUE-Coder(代码助手测评基准)

  • 推荐文章: 代码助手测评」启动,SC-Coder测评方案公布
Panda

(5)SuperCLUE-RAG(中文原生检索增强生成测评基准)

  • 推荐文章: 中文RAG检索增强生成榜单出炉!仅有一家刚刚及格
  • 项目地址: https://github.com/CLUEbenchmark/SuperCLUE-RAG
Panda

(6)SuperCLUE-Agent(Agent能力测评基准)

  • 推荐文章: SuperCLUE-Agent: Agent智能体中文原生任务能力测评基准
  • 项目地址: https://github.com/CLUEbenchmark/SuperCLUE-Agent
Panda

(7)SuperCLUE-Image(中文原生文生图测评基准)

  • 推荐文章: 文生图大模型基准测评首期榜单公布,DALL-E 3取得最高76.94分
  • 项目地址: https://github.com/CLUEbenchmark/SuperCLUE-Image
Panda
Panda
http://www.lryc.cn/news/390247.html

相关文章:

  • 工厂模式之简单工厂模式
  • 2.(vue3.x+vite)调用iframe的方法(vue编码)
  • 实战项目——用Java实现图书管理系统
  • 利用DeepFlow解决APISIX故障诊断中的方向偏差问题
  • sqlalchemy获取数据条数
  • SpringBoot的自动配置核心原理及拓展点
  • 用随机森林算法进行的一次故障预测
  • 24位DAC转换的FPGA设计及将其封装成自定义IP核的方法
  • 【大模型LLM面试合集】大语言模型基础_llm概念
  • Qt时间日期处理与定时器使用总结
  • 数据结构——Hash Map
  • 剪画小程序:视频剪辑-视频播放倍数的调整与应用
  • 使用 Java Swing 和 XChart 创建多种图表
  • 信息系统运维管理:实践与发展
  • html+js+css登录注册界面
  • 英伟达(NVIDIA)数据中心GPU介绍
  • Leetcode 3202. Find the Maximum Length of Valid Subsequence II
  • 通过Spring Boot结合实时流媒体技术对考试过程进行实时监控
  • 智能扫地机器人避障与防跌落问题解决方案
  • 德旺训练营称重问题
  • 数据决策系统详解
  • JSON 简述与应用
  • ResNet50V2
  • 基于深度学习的虚拟换装
  • 单段时间最优S型速度规划算法
  • pom文件-微服务项目结构
  • 解析Kotlin中的Nothing【笔记摘要】
  • toRefs 和 toRef
  • Vision Transformer论文阅读笔记
  • MapReduce的执行流程排序