当前位置: 首页 > news >正文

Mistral 7B 比Llama 2更好的开源大模型 (一)

Mistral 7B 简介

Mistral 7B

Mistral 7B 是一个 7.3B 参数模型:

  • 在所有基准测试中优于 Llama 2 13B
  • 在许多基准测试中优于 Llama 1 34B
  • 接近 CodeLlama 7B 的代码性能,同时保持擅长英语任务
  • 使用分组查询注意力 (GQA) 加快推理速度
  • 使用滑动窗口注意力 (SWA) 以更低的成本处理更长的序列

性能细节

将 Mistral 7B 与 Llama 2 系列进行比较,运行所有模型评估,以便进行公平比较。
在这里插入图片描述

Mistral 7B 和不同 Llama 模型在各种基准测试中的性能。Mistral 7B 在所有指标上都明显优于 Llama 2 13B,与 Llama 34B 相当,在代码和推理基准方面也非常出色。

基准测试按其主题分类:

  • 常识推理: 0-shot average of Hellaswag, Winogrande, PIQA, SIQA, OpenbookQA, ARC-Easy, ARC-Challenge, and CommonsenseQA.
  • 世界知识: 5-shot average of NaturalQuestions and TriviaQA.
  • 阅读理解: 0-shot average of BoolQ and QuAC.
  • 数学 : Average of 8-shot GSM8K with maj@8 and 4-shot MATH with maj@4
http://www.lryc.cn/news/229773.html

相关文章:

  • 【JUC】三、集合的线程安全
  • 使用 Redis 实现生成分布式全局唯一ID(使用SpringBoot环境实现)
  • Pytorch CUDA CPP简易教程,在Windows上操作
  • 服务器怎么连接
  • 线性代数-Python-05:矩阵的逆+LU分解
  • shell实用脚本命令
  • STM32——端口复用与重映射概述与配置(HAL库)
  • ABZ正交编码 - 异步电机常用的位置信息确定方式
  • Linux学习第41天:Linux SPI 驱动实验(二):乾坤大挪移
  • 黑客泄露 3500 万条 LinkedIn 用户记录
  • Flink SQL -- 反压
  • 快速入门安装及使用git与svn的区别常用命令
  • 超详细介绍如何使用 OpenCV 和 BGS 库进行背景扣除
  • STM32F4、GD32F4 内部硬件CRC使用方法和踩坑实录
  • 【SpringBoot】序列化和反序列化介绍
  • Android 升级软件后清空工厂模式测试进度
  • Promise原理、以及Promise.race、Promise.all、Promise.resolve、Promise.reject实现;
  • mysql---MHA(高可用)
  • 人工智能基础_机器学习032_多项式回归升维_原理理解---人工智能工作笔记0072
  • C#截取范围
  • 用 winget 在 Windows 上安装 kubectl
  • 1 Supervised Machine Learning Regression and Classification
  • Antv/G2 折线图 DataSet 数据展开成指定格式
  • 物理问题中常见的分析问题----什么样的函数性质较好
  • 8 Go的函数
  • 算法笔记-第九章-二叉树的遍历(待整理)
  • C语言从入门到精通之【字符串】
  • 超详细!必看!!STM32--时钟树原理
  • 用 Golang 采集 Nginx 接口流量大小
  • Linux java jar启停脚本(合并版)