当前位置: 首页 > news >正文

FastEdit ⚡:在10秒内编辑大型语言模型

概述: 这个仓库旨在通过一个单一的命令,有效地将新鲜且定制化的知识注入到大型语言模型中,以辅助开发人员的工作。

d8f3c47d4139576fe867bc17aacc74bf.jpeg
支持的模型:

○ GPT-J (6B)

○ LLaMA (7B/13B)

○ BLOOM (7.1B)

○ Falcon (7B)

○ Baichuan (7B/13B)

○ InternLM (7B)

实现的算法:

○ 一阶模型编辑 (ROME)

要求:

○ Python 3.8+ 和 PyTorch 1.13.1+

○ 🤗Transformers, Datasets 和 Accelerate

○ sentencepiece 和 fire

硬件要求:

○ 对于LLaMA 7B模型:24GB内存,每次编辑7秒

○ 对于LLaMA 13B模型:32GB内存,每次编辑9秒

入门指南: 数据准备: 例如,如果我们想要将事实知识“英国的首相是Rishi Sunak”插入到LLM中,我们需要准备一个类似以下格式的json文件。 [ { "prompt": "The prime minister of the {} is", "subject": "UK", "target": "Rishi Sunak", "queries": [] } ] 在这个格式中,"prompt"字段表示用于插入知识的模板,"subject"表示主体,"target"表示目标,"queries"表示附加的查询信息。

项目:hiyouga/FastEdit

http://www.lryc.cn/news/95114.html

相关文章:

  • SpringBoot + Docker 实现一次构建到处运行
  • Spring-Cloud-Gateway如何自定义断言工厂?
  • Android平台如何高效率实现GB28181对接?
  • vue2 实现后台管理系统左侧菜单联动实现 tab根据路由切换联动内容,并支持移动端框架
  • 一本通1910:【00NOIP普及组】计算器的改良题解
  • golang网络编程学习-1rpc
  • 【MQTT】Esp32数据上传采集:最新mqtt插件(支持掉线、真机调试错误等问题)
  • 基于PyQt5的UI界面开发——对基本控件的介绍
  • flink 报错:Caused by: java.lang.RuntimeException: Assigned key must not be null!
  • AN OVERVIEW OF LANGUAGE MODELS RECENT DEVELOPMENTS AND OUTLOOK
  • ArcGIS、ENVI、InVEST、FRAGSTATS等多技术融合提升
  • fastapi初使用,构建自己的api
  • Html基础知识学习——圣杯布局、margin负值、等高布局(十七)
  • 从一长串字符串中找出图片,查看是否符合md5要求
  • 新手小白如何学好UI设计?一般学多久? 优漫动游
  • 实现 Rollup 插件alias 并使用vitest提高开发效率
  • 【DSL】ES+DSL 查询语法
  • Vue第三篇:最简单的vue购物车示例
  • MFC 基于数据库的管理系统
  • EfficientNet论文笔记
  • 系统学习Linux-SSH远程服务(二)
  • PyTorch训练RNN, GRU, LSTM:手写数字识别
  • 基于深度学习的高精度道路瑕疵检测系统(PyTorch+Pyside6+YOLOv5模型)
  • 【裸辞转行】是告别,也是新的开始
  • 了解交换机接口的链路类型(access、trunk、hybrid)
  • Android系统启动流程分析
  • 如何在Ubuntu上安装OpenneBula
  • 解决MySQL中分页查询时多页有重复数据,实际只有一条数据的问题
  • 【数据结构】时间复杂度---OJ练习题
  • 京东自动化功能之商品信息监控是否有库存