当前位置: 首页 > news >正文

一文读懂Llama 2(从原理到实战)

简介

Llama 2,是Meta AI正式发布的最新一代开源大模型。

Llama 2训练所用的token翻了一倍至2万亿,同时对于使用大模型最重要的上下文长度限制,Llama 2也翻了一倍。Llama 2包含了70亿、130亿和700亿参数的模型。Meta宣布将与微软Azure进行合作,向其全球开发者提供基于Llama 2模型的云服务。同时Meta还将联手高通,让Llama 2能够在高通芯片上运行。

Llama 2是一系列预训练和微调的大型语言模型(LLMs),参数规模从70亿到700亿不等。Meta的微调LLMs,叫做Llama 2-Chat,是为对话场景而优化的。Llama 2模型在大多数基准上都比开源的对话模型表现得更好,并且根据人类评估的有用性和安全性,可能是闭源模型的合适替代品。Meta提供了他们对Llama 2-Chat进行微调和安全改进的方法的详细描述。
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
github地址:https://github.com/facebookresearch/llama-recipes
开源7B、13B、70B模型(7B模型约12.5GB,13B模型需要24.2GB)

实战:微调Llama 2

  • 1.首先我们从github上下载Llama 2的微调代码:
git clone https://github.com/facebookresearch/llama-recipes .
  • 2.下载完成之后,安装对应环境,执行命令:
pip install -r requirements.txt
  • 3.接着我们从HuggingFace上下载模型,可以看到目前有多个版本可供选择,这里我们就选择Llama-2-7b-half:
import huggingface_hubhuggingface_hub.snapshot_download("meta-llama/Llama-2-7b-hf",local_dir="./Llama-2-7b-hf",token="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"
)

这里的token可以在HuggingFace中获取,如下图所示:
在这里插入图片描述

  • 4.下载数据,这里选择GuanacoDataset数据集。数据格式如下:
    在这里插入图片描述

在线体验

在这里插入图片描述

参考

https://github.com/facebookresearch/llama-recipes
https://zhuanlan.zhihu.com/p/653303123

http://www.lryc.cn/news/179019.html

相关文章:

  • 完整指南:如何使用 Node.js 复制文件
  • ElementUI - 主页面--动态树右侧内容管理
  • 全国排名前三的直播公司无锋科技入驻天府蜂巢成都直播产业基地
  • 机器人中的数值优化|【五】BFGS算法非凸/非光滑处理
  • ESP32S3的MPU-6050组件移植教程
  • excel筛选后求和
  • pyspark 检测任务输出目录是否空,避免读取报错
  • 「网页开发|前端开发|Vue」10 vuex模块化:将数据划分成不同modules分别管理
  • 苹果CMS插件-苹果CMS全套插件免费
  • 域环境介绍
  • 地球同步静止轨道上的中国卫星
  • HAProxy代理TCP(使用HAProxy 为TiDB-Server 做负载均衡)
  • 全新自适应导航网模板 导航网系统源码 网址导航系统源码 网址目录网系统源码
  • 无人直播间
  • Linux 服务器防止 ssh 暴力密码登录破解之使用 fail2ban
  • 第十四届蓝桥杯大赛软件赛决赛 C/C++ 大学 B 组 试题 D: 合并数列
  • ChatGPT必应联网功能正式上线
  • DETR中的问题汇总(代码)
  • 华为云云耀云服务器L实例评测|使用华为云耀云服务器L实例的CentOS部署Docker并运行Tomcat应用
  • Java基础---第八篇
  • (附源码)springboot体检预约APP 计算机毕设16370
  • Spring的注解开发-@Component的三个衍生注解
  • 无线WIFI工业路由器可用于楼宇自动化
  • 基于长短期神经网络铜期货价格预测,基于LSTM的铜期货价格预测,LSTM的详细原理
  • 300元开放式耳机推荐哪个、最值得入手的开放式耳机推荐
  • 嵌入式学习笔记(37) S5PV210的PWM定时器
  • python工具-base64-zip-json
  • Centos 7安装pm2 , 操作等常用命令
  • vue 实现弹出菜单,解决鼠标点击其他区域的检测问题
  • 经典网络解(三) 生成模型VAE | 自编码器、变分自编码器|有监督,无监督