当前位置: 首页 > news >正文

马斯克旗下xAI发布Grok-1.5,相比较开源的Grok-1,各项性能大幅提升,接近GPT-4!

本文原文来自DataLearnerAI官方网站:马斯克旗下xAI发布Grok-1.5,相比较开源的Grok-1,各项性能大幅提升,接近GPT-4! | 数据学习者官方网站(Datalearner)

继Grok-1开源之后,xAI宣布了Grok-1.5的内测消息,并预告即将全面商用,这一消息无疑为AI技术爱好者和开发者社区带来了新的兴奋点。

Grok-1.5的技术突破

Grok-1.5在性能上的提升是显著的。根据官方发布的数据,Grok-1.5在综合理解能力MMLU评测上达到了81.3分,超越了MistralAI的Mixtral Large模型。在数学推理能力GSM8K的评测中,Grok-1.5更是取得了90分的高分,与业界领先的GPT-4和Claude-3 Sonnet相差无几。

Grok-1.5在DataLearnerAI综合评测排行

在DataLearnerAI收集的全球大模型综合评测数据上,Grok-1.5表现也非常好。按照GSM8K排序,结果如下:

数据来源:大模型综合评测对比 | 当前主流大模型在各评测数据集上的表现总榜单 | 数据学习 (DataLearner)

可以看到,GSM8K在目前的评测上,Grok-1.5已经是全球第四,最好的模型之一了。其它评测结果也是类似,说明Grok-1.5已经达到了第一梯队。而按照编程能力评测的结果,以Human Eval排序为例,结果如下:

数据来源:大模型代码能力评测对比 | 当前主流大模型在代码能力上的表现总榜单 | 数据学习 (DataLearner)

可以看到,Grok-1.5依然排名很高,作为一个综合基础大模型,这样的成绩非常好。略超Claude3-Sonnet!

支持128K上下文长度

Grok-1.5的另一个亮点是支持最高128K的上下文长度,这是第一代Grok-1的8K上下文长度的显著提升。在大海捞针测试中,Grok-1.5表现出色,这一特性对于处理长文本和复杂对话场景具有重要意义。

关于Grok-1.5的详情参考DataLearnerAI原文:马斯克旗下xAI发布Grok-1.5,相比较开源的Grok-1,各项性能大幅提升,接近GPT-4! | 数据学习者官方网站(Datalearner)

http://www.lryc.cn/news/329994.html

相关文章:

  • 数据结构与算法 顺序串的基本运算
  • 2024年04月数据库流行度最新排名
  • golang语言系列:SOLID、YAGNI、KISS等设计原则
  • Meta Pixel:助你实现高效地Facebook广告追踪
  • 基于Arduino IDE 野火ESP8266模块 文件系统LittleFS 的开发
  • 通讯录改造———文件版本
  • FastAPI Web框架教程 第13章 WebSocket
  • 将 Elasticsearch 向量数据库引入到数据上的 Azure OpenAI 服务(预览)
  • SeLinux 常见的宏
  • 图解PyTorch中的torch.gather函数和 scatter 函数
  • Pytorch实用教程: torch.tensor()的用法
  • Java设计模式详解:工厂模式
  • Python爬虫:爬虫常用伪装手段
  • 【数据结构】非线性结构---二叉树
  • 【战略前沿】与中国达成生产协议后,飞行汽车即将起飞
  • 谷粒商城实战(007 压力测试)
  • 使用CSS计数器,在目录名称前加上了序号,让目录看起来更加井然有序
  • SSH常见运维总结
  • uni app 扫雷
  • MATLAB绘制堆叠填充图--巧用句柄
  • JQuery的定义
  • 【操作系统】FCFS、SJF、HRRN、RR、EDF、LLF调度算法及python实现代码
  • Image-Adaptive YOLO for Object Detection in Adverse Weather Conditions(IA-YOLO)
  • Mac电脑Jmeter集成到Jenkins,压测多个接口并生成测试报告
  • redis-Hash
  • Kubernetes kafka系列 | Strimzi 部署kafka-bridge
  • AR和VR如何改变客户体验?
  • 微信小程序中实现埋点的方法
  • vue记事本渲染以及交互
  • Zookeeper中的脑裂