当前位置: 首页 > news >正文

【论文笔记】Transformer^2: 自适应大型语言模型

在这里插入图片描述

Code repo: https://github.com/SakanaAI/self-adaptive-llms


摘要

自适应大型语言模型(LLMs)旨在解决传统微调方法的挑战,这些方法通常计算密集且难以处理多样化的任务。本文介绍了Transformer²(Transformer-Squared),一种新颖的自适应框架,通过在推理时选择性地调整权重矩阵的单个奇异分量来实时适应未见过的任务。Transformer²在参数数量较少且效率更高的情况下,持续优于LoRA等常用方法。此外,Transformer²在不同LLM架构和模态(包括视觉语言任务)中表现出色,代表了自适应LLMs的重大进步。

引言

自适应LLMs代表了人工智能的重大进步,提供了一个框架,使模型能够实时调整以适应不同的任务和动态环境。传统的LLM训练方法试图在一次广泛的训练会话中优化模型的多种能力,这在实践中难以实现。相比之下,自适应模型提供了一种更灵活和高效的方法,允许模型根据手头的任务动态修改其行为。

相关工作

  • 自适应LLMs:定义为一组LLMs或一个独立的LLM,能够响应其操作环境或内部状态的变化而评估和修改其行为。
  • 低秩适应:如LoRA,通过引入小的可训练低秩矩阵来实现任务特定的更新。
  • SVD用于LLM微调:使用SVD来近似原始权重矩阵,以提高效率。

方法

在这里插入图片描述

Transformer²

Transformer²的构建包括两个主要步骤:

  1. 奇异值微调(SVF):通过RL学习紧凑且可组合的专家向量,基于基础模型权重的SVD。

  2. 自适应策略:在推理时动态组合SVF训练的专家向量,提供三种不同的自适应策略:

    • 提示工程:构建新的“适应”提示,直接询问LLM分类输入提示。
    • 分类专家:使用专门的系统处理任务识别。
    • 少样本适应:通过线性插值在K个学习到的SVF向量之间进行加权组合。

实验

实验评估了Transformer²在多个任务和模型上的表现:

  1. SVF性能:在GSM8K、MBPP-Pro和ARC-Easy任务上,SVF提供了显著且一致的性能提升。
  2. 自适应性能:在未见过的任务(如MATH、Humaneval、ARC-Challenge)上,Transformer²的自适应策略展示了改进。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

结论

本文介绍了Transformer²,提供了一个实现自适应LLMs的新蓝图。通过SVF和三种自适应策略,Transformer²展示了在提高模型适应性和任务特定性能方面的优势。未来的工作可以集中在模型合并和高效适应技术上,以实现更强大的自适应LLMs。

http://www.lryc.cn/news/538538.html

相关文章:

  • FFmpeg源码:av_strlcpy函数分析
  • Unity Shader学习6:多盏平行光+点光源 ( 逐像素 ) 前向渲染 (Built-In)
  • docker批量pull/save/load/tag/push镜像shell脚本
  • 五十天精通硬件设计第32天-S参数
  • 6.2.4 基本的数据模型
  • DeepSeek ,银行营销会被 AIGC 颠覆吗?
  • 第150场双周赛:好数字之和、分割正方形 Ⅰ、分割正方形 Ⅱ、最短匹配字符串
  • HDFS是如何存储和管理大数据
  • 进阶——第十六届蓝桥杯嵌入式熟练度练习(开发板捕获频率和占空比)
  • 智能协同:数据集成平台与DeepSeek驱动的数据分析与智能调度革新
  • Mybatis高级(动态SQL)
  • 申论对策建议类【2022江苏B卷第一题“如何开展网络直播”】
  • 蓝耘智算携手DeepSeek,共创AI未来
  • FFmpeg源码:url_find_protocol函数分析
  • 3D与2D机器视觉机械臂引导的区别
  • C# 添加图标
  • 基于 Python 和 Django 的北极星招聘数据可视化系统(附源码,部署)
  • 基于STM32、HAL库、MB85RC16PNF(I2C接口)驱动程序设计
  • 【产品推介】可驱动5A负载的降压型DC/DC转换器XBL1663
  • 20.【线性代数】——坐标系中,平行四边形面积=矩阵的行列式
  • 数据库知识速记:事物隔离级别
  • 重构测试项目为spring+springMVC+Mybatis框架
  • 如何使用OPENAI的Whisper功能进行音频字母提取功能
  • DFS算法篇:理解递归,熟悉递归,成为递归
  • 2025java常见面试题第一弹
  • JMeter工具介绍、元件和组件的介绍
  • 机舱卫生和空气质量改善
  • springBoot之环境变量
  • 萨班斯-奥克斯利法案(Sarbanes-Oxley Act, SOX):公司财务透明度的守护者(中英双语)
  • iOS 中使用 FFmpeg 的高级功能 - 滤镜(Filters)