当前位置: 首页 > news >正文

LongLLMLingua: 长上下文场景的智能提示压缩框架

LongLLMLingua: 长上下文场景的智能提示压缩框架

一、框架概述

  1. 核心目标
  • 解决长上下文场景下的计算成本问题
  • 降低处理延迟
  • 提升模型性能表现
  1. 创新特点
  • 问题感知的粗到细压缩策略
  • 文档重排序机制
  • 动态压缩比例控制
  • 压缩后的子序列恢复策略

二、技术方法详解

  1. 粗粒度压缩
    (a) 文档评分机制
  • 使用文档级困惑度(perplexity)计算重要性分数r_k
  • 困惑度越低表示模型预测越准确,文档越重要
  • 评分公式: 结合问题文本(x_que)和限制文本(x_restrict)计算

(b) 低困惑度文档筛选

  • 保留最相关的K’个文档
  • 通过阈值动态调整保留数量
  1. 细粒度压缩
    (a) 重要性评估
  • 分别评估指令(x_ins)、问题(x_que)和文档中每个标记
  • 采用迭代压缩机制
  • 直接计算标记级困惑度

(b) 对比困惑度创新

  • 引入对比困惑度概念
  • 计算问题条件下的分布偏移
  • 更准确识别问题相关标记
  1. 信息重排序策略
  • 基于文档重要性分数进行重新排序
  • 将关键信息置于文档前部
  • 缓解中间信息丢失问题
  1. 动态压缩控制
  • 初始预算确定(τ_doc)
  • 根据文档重要性动态分配压缩预算
  • 使用线性调度器进行自适应分配
  • 预算分配公式包含文档数量(Nd)和控制参数(δτ)

三、实验评估

  1. 评估环境
    数据集:
  • NaturalQuestions
  • LongBench
  • ZeroSCROLLS

对比基线:

  • 检索类方法:BM25、Gzip、Sentence-BERT、OpenAI Embedding
  • 压缩类方法:Selective Context、LLMLingua

目标模型:

  • GPT-3.5-Turbo-06134
  • LongChat-13B-16k
  1. 性能表现
    (a) 效果性能
  • 在各种压缩比例下保持领先
  • 显著减少输入标记数量
  • 维持较高的任务准确率

(b) 效率提升

  • 响应延迟大幅降低
  • API调用时间明显缩短
  • 压缩率越高,效率提升越明显
  1. 消融实验结果
  • 问题感知机制贡献显著
  • 动态压缩比例证明必要
  • 子序列恢复策略效果明显
  • SBERT用于粗粒度压缩效果较差

四、技术优势总结

  1. 信息保留
  • 高效保留问题相关信息
  • 维持关键实体完整性
  • 减少中间信息丢失
  1. 自适应能力
  • 智能调节压缩比例
  • 动态分配压缩预算
  • 灵活应对不同场景
  1. 实用价值
  • 降低计算资源消耗
  • 提升处理效率
  • 保持模型性能
http://www.lryc.cn/news/511522.html

相关文章:

  • Django serializers:把ValidationError处理的更优雅
  • CASA(Carnegie-Ames-Stanford Approach) 模型原理及实践技术
  • 【HarmonyOS之旅】ArkTS语法(一)
  • 【畅购电商】项目总结
  • python|利用ffmpeg按顺序合并指定目录内的ts文件
  • IP属地和所在地不一致什么意思?怎么换成另外一个地方的
  • Hive其十,优化和数据倾斜
  • matlab reshape permute
  • 数据库sql语句单表查询
  • Linux高级--2.4.2 linux TCP 系列操作函数 -- 深层理解
  • 科技快讯 | 水滴筹成为民政部指定个人求助网络服务平台;小米超级小爱首次向正式版用户开放;腾讯发布全球首个重症医疗大模型
  • 强化特种作业管理,筑牢安全生产防线
  • 跨语言学习之C++ 和 Python 的赋值操作 (等号“=“) 的区别
  • 【操作系统】如何创建一个守护进程
  • 常见显示方案
  • USB Hub 检测设备
  • 安卓开发使用Gemini高效AI开发-Android Studio 中使用Gemini
  • wangEditor富文本插件在vue项目中使用和媒体上传的实现
  • ESP-IDF学习记录(2)ESP-IDF 扩展的简单使用
  • python中函数的用法总结(二阶段)
  • 一份关于 Ubuntu 系统下代理配置的故障排查笔记
  • 使用 Colyseus 构建多人实时白板应用
  • 【探花交友】SpringCache
  • Spring API 接口加密/解密
  • 漏洞扫描:网络安全的 “体检” 与 “防护指南”
  • 【可靠有效】springboot使用netty搭建TCP服务器
  • 机器视觉中的单线程、多线程与跨线程:原理与应用解析
  • 0040__Linux内核4.14版本——drm框架分析(1)——drm简介
  • 珞珈一号夜光遥感数据地理配准,栅格数据地理配准
  • 【GlobalMapper精品教程】091:根据指定字段融合图斑(字段值相同融合到一起)