当前位置: 首页 > news >正文

开源大模型源代码

开源大模型的源代码可以在多个平台上找到,以下是一些知名的开源大模型及其源代码的获取方式:

1. **艾伦人工智能研究所的开放大语言模型(Open Language Model,OLMo)**:
   - 提供了完整的模型权重、训练代码、训练日志、消融研究、训练指标和推理代码。
   - 包含了一个高达3T token的预训练开源语料库,以及产生这些训练数据的代码。
   - 提供了四个不同架构、优化器和训练硬件体系下的7B大小的模型,以及一个1B大小的模型,所有模型都在至少2T token上进行了训练。
   - 提供了用于模型推理的代码、训练过程的各项指标以及训练日志<searchIndex index="1" />。

2. **BERT**:
   - BERT项目的源代码可以在GitHub上找到,地址为:https://github.com/google-research/bert#fine-tuning-with-bert<searchIndex index="2" />。

3. **ELMo**:
   - ELMO的源代码可以在GitHub上找到,地址为:https://github.com/allenai/allennlp<searchIndex index="2" />。

4. **蚂蚁集团的CodeFuse**:
   - CodeFuse是一个代码大模型,已经开源,可以在HuggingFace下载模型。
   - 开源内容包括代码框架、模型等,其中模型包括CodeFuse-13B、CodeFuse-CodeLlaMa34B-MFT两个大模型。

5. **DeepSeek Coder**:
   - DeepSeek Coder是一个智能代码助手,可以在Hugging Face和GitHub上开源。
   - 在国际权威数据集的测试中表现出色<searchIndex index="3" />。

6. **LLaMA**:
   - LLaMA的源码可以在transformers仓库中找到,地址为:https://github.com/huggingface/transformers<searchIndex index="4" />。

请注意,获取开源大模型的源代码时,需要遵守相应的许可协议,并在使用时引用原始来源。同时,由于开源项目的更新和维护可能会发生变化,建议直接访问上述提供的链接以获取最新的源代码和相关信息。

http://www.lryc.cn/news/358824.html

相关文章:

  • 算法思想总结:哈希表
  • 基于Docker搭建属于你的CC++集成编译环境
  • 如何限制上网行为?上网行为管控软件有什么功能?
  • 重庆耶非凡科技有限公司的选品师项目靠谱吗?
  • 基于Cloudflare/CloudDNS/GitHub使用免费域名部署NewBing的AI服务
  • redux状态管理用法详解
  • 细说ARM MCU中的MX_GPIO_Init()函数的实现过程
  • 【wordpress】网站提示Error establishing a database connection错误代码
  • 图书管理系统——Java实现
  • Capto 标准版【简体中文+Mac 】
  • 连锁收银系统的五大功能 会员营销是核心
  • 射频功率限幅器简略
  • [备忘] Reboot Linux in python
  • windows打开工程文件是顺序读写吗
  • 【Python】解决Python报错:AttributeError: ‘generator‘ object has no attribute ‘xxx‘
  • 【1800】【5.22-5.24】
  • 统计各个商品今年销售额与去年销售额的增长率及排名变化
  • 华为校招机试 - 矿车运输成本(20240522)
  • 【C++奇技淫巧】CRTP(奇特重现模板模式)
  • web学习笔记(六十一)
  • Nginx在Docker中的应用:容器化部署与扩展
  • vscode编译和调试wsl环境的c语言程序
  • (CPU/GPU)粒子继承贴图颜色发射
  • 【C#】 一个窗体能够显示、最小化、最大化、关闭时分别触发方法
  • pgsql基本操作
  • 3d渲染的常用概念和技术,渲染100邀请码1a12
  • 热敏电阻的设计
  • macOS上编译android的ffmpeg及ffmpeg.c
  • RxSwift - 实现一个MVVM架构的TableView
  • 在 CentOS 7 上安装并配置 Redis 允许远程连接的详细教程