当前位置: 首页 > news >正文

MEMORY-VQ: Compression for Tractable Internet-Scale Memory

本文是深度学习相关文章,针对《MEMORY-VQ: Compression for Tractable Internet-Scale Memory》的翻译。

MEMORY-VQ:可追溯互联网规模存储器的压缩

  • 摘要
  • 1 引言
  • 2 背景
  • 3 MEMORY-VQ
  • 4 实验
  • 5 相关工作
  • 6 结论

摘要

检索增强是一种强大但昂贵的方法,可以使语言模型更了解世界。基于记忆的方法,如LUMEN,为检索到的段落预先计算token表示,以大大加快推理速度。然而,存储预计算的表示也会对内存产生更大的存储需求。
我们提出了MEMORY-VQ,这是一种在不牺牲性能的情况下降低内存增强模型存储需求的新方法。我们的方法使用矢量量化变分自动编码器(VQ-VAE)来压缩token表示。我们将MEMORY-VQ应用于LUMEN模型以获得LUMEN-VQ,这是一种在KILT基准上实现16x压缩率且性能相当的存储器模型。LUMEN-VQ能够实现实用的检索增强,即使是对于超大的检索语料库。

1 引言

2 背景

3 MEMORY-VQ

4 实验

5 相关工作

6 结论

我们介绍了MEMORY-VQ,这是一种在不影响性能的情况下降低内存增强语言模型存储需求的新方法。通过使用VQ-VAE来压缩token表示,我们获得了具有16x压缩的LUMEN模型,表示为LUMENVQ。值得注意的是,LUMEN-VQ保持了接近LUMEN和FiD的性能,并受益于LUMEN推理速度的提高和存储成本的大幅降低。使用MEMORY-VQ,记忆增强是一种实用的解决方案,可以在大量检索语料库的情况下大幅提高推理速度。

http://www.lryc.cn/news/154472.html

相关文章:

  • Netty—ChannelHandler
  • Android 集成onenet物联网平台
  • java八股文面试[JVM]——如何打破双亲委派模型
  • 一加11/Ace2/10Pro手机如何实现全局120HZ高刷-游戏超级流畅效果
  • 微服务主流框架概览
  • Python Flask Web开发二:数据库创建和使用
  • 快速学会git版本管理——上传gitee仓库
  • 应用在智能洗衣机触摸屏上的电容式触摸芯片
  • npm版本升级报错
  • Vue+Element-ui+SpringBoot搭建后端汽车租赁管理系统
  • PKU校园网连接失败
  • STM32存储左右互搏 I2C总线读写FRAM MB85RC16
  • 【typeof instanceof Object.prototype.toString constructor区别】
  • ARM Codec要求
  • QT多线程
  • 【linux命令讲解大全】059.命令行利器:快速执行指定命令的command命令
  • opencv-4.5.2-android-sdk.zip安装教程
  • 接口自动化测试系列-excel管理测试用例
  • Spring——Spring的控制反转IOC
  • 基于CentOS7.5构建LVS-DR 群集,并启用Nginx负载均衡,一键完成。
  • redis 数据结构(二)
  • Hadoop依赖环境配置与安装部署
  • [C++网络协议] I/O复用
  • 3D数据导出工具HOOPS Publish:3D数据查看、生成标准PDF或HTML文档!
  • [羊城杯 2023] web
  • Redisson—独立节点模式和集群管理工具
  • 基于RabbitMQ的模拟消息队列之五——虚拟主机设计
  • Hadoop的概述与安装
  • 进程、线程与构造方法
  • 04 Linux补充|C/C++