当前位置: 首页 > news >正文

OLMo:真正完全开源的大模型

最近,又有一家机构AI2(Allen Institute for AI)开源了一个LLM:OLMo,它的英文全称就叫Open Language Model。相比之前开源的大模型,OLMo的独特之处是完全开源,除了训练的模型,OLMo还开源了训练数据,训练代码以及模型评估代码。换句话说,只要你有GPU卡,再基于OLMo开源的数据和代码,就可以自己快速从零训练一个自己的LLM。

图片

图片

除了数据,代码和模型,OLMo还直接公开了训练模型的日志:

博客:https://blog.allenai.org/olmo-open-language-model-87ccfc95f580

代码:GitHub - allenai/OLMo: Modeling, training, eval, and inference code for OLMo

数据:GitHub - allenai/dolma: Data and tools for generating and inspecting OLMo pre-training data.

论文:https://arxiv.org/abs/2402.00838

模型:https://huggingface.co/allenai/OLMo-7B

评估:https://github.com/allenai/OLMo-Eval

微调:https://github.com/allenai/open-instruct

日志:https://wandb.ai/ai2-llm/OLMo-7B/reports/OLMo-7B--Vmlldzo2NzQyMzk5

OLMo的训练数据Dolma是一个开放的数据集,包含3万亿个来自不同类型网络内容、学术出版物、代码、书籍和百科资料的词汇。Dolma不仅完全开源,而且同时也公开了构建数据集的工具包。

OLMo目前开源的模型主要有三个规模:

图片

图片

其中65B的模型还在训练中,目前开源的最大模型是OLMo 7B:

图片

图片

OLMo 7B在大部分的评测上和Meta开源的Llama 2 7B相当:

图片

图片

除了预训练模型,OLMo 7B还提供了对应的微调版本OLMo 7B Instruct:

图片

图片

虽然目前AI2开源的OLMo在效果上并没有那么惊艳,但是OLMo是完全的开源,对于LLM的入门选手,OLMo可能是一个快速的开始。而且AI2还会持续开源,OLMo只是一个开始:

This release is just the beginning for OLMo and the framework. Work is already underway on different model sizes, modalities, datasets, safety measures, and evaluations for the OLMo family. Our goal is to collaboratively build the best open language model in the world, and today we have taken the first step.

未来,开源是大势所趋。

http://www.lryc.cn/news/387086.html

相关文章:

  • 51单片机STC89C52RC——12.1 数据存储芯片AT24C02
  • 融入云端的心跳:在Spring Cloud应用中集成Eureka Client
  • CocosCreator构建IOS的wwise教程
  • 掌握 SQL Server 中的 FLOOR 函数:数据舍入的艺术
  • 【折腾笔记】兰空图床使用Redis做缓存
  • 【Ubuntu】如何用指令设置静态IP
  • mechanize - 自动化与HTTP web服务器的交互操作
  • 【Android】保留elevation层级效果,舍弃阴影效果
  • Java新手启航:Windows下JDK安装,开启编程之旅
  • c++指针和引用之高难度(二)习题讲解
  • UNIAPP编译到微信小程序时,会多一层以组件命名的标签
  • 工业自动化控制中心
  • 【Git】GitIgnore不生效
  • 面向对象,常用类,集合,异常,JDBC,mysql数据库内容的复习,
  • HTML5+JavaScript单词游戏
  • Windows 中的 Hosts 文件是什么?如何找到并修改它?
  • 详细分析Oracle中的tnsnames.ora基本知识 以及 PLSQL如何连接(附Demo)
  • [深度学习] 图神经网络GNN
  • MATLAB中添加 Git 子模块
  • 24级中国科学技术大学843信号与系统考研分数线,中科大843初复试科目,参考书,大纲,真题,苏医工生医电子信息与通信工程。
  • 深入剖析C语言中volatile与register关键字的实战应用与底层原理
  • vue开发网站--关于window.print()调取打印
  • OJ-选座位
  • 【子串】3. 无重复的最长子串
  • Scrapy中爬虫优化技巧分享
  • 自然语言处理-BERT处理框架-transformer
  • Kafka~消息系列问题解决:消费顺序问题解决、消息丢失问题优化(不能保证100%)
  • 如何确保日常安全运维中的数据加密符合等保2.0标准?
  • 下一代的JDK - GraalVM
  • Java三方库-单元测试