当前位置: 首页 > news >正文

REMARK-LLM:用于生成大型语言模型的稳健且高效的水印框架

REMARK-LLM:用于生成大型语言模型的稳健且高效的水印框架

前言

  • 提出这一模型的初衷

为了应对大量计算资源和数据集出现伴随的知识产权问题。使用LLM合成类似人类的内容容易受到恶意利用,包括垃圾邮件和抄袭。
ChatGPT等大语言模型LLM的开发取得的进展标志着人机对话交互的范式转变。与此同时,需要设计机制来声明LLM生成的文本的所有权并跟踪生成内容的发布
水印提供了一种有希望的解决方案来解决两个长期存在的问题:主张生成输出的所有权和追踪内容来源。通过将水印签名嵌入到LLM的输出中,模型所有者可以有效地监控其内容使用情况并验证其所有权

  • 模型的亮点

REMARK-LLM提出了三个新组件:
1、基于学习的信息编码模块,将二进制签名注入LLM生成的文本中。将LLM生成的文本及其相应的签名编码到潜在特征空间中。添加它们的特征表示并产生词汇表上的水印分布。
2、重新参数化模块,将消息编码的密集分布转换为带水印文本标记的稀疏分布。
3、专用于签名提取的信息解码模块,利用转换器预测插入的消息,从而提取水印签名。
三个模块都是端到端训练,目标是
1、通过最小化LLM生成的文本和加水印的文本之间的语义损失来保持语义保真度
2、通过最小化插入和从加水印的文本中提取的水印签名之间的消息恢复损失来确保水印提取、
3、通过从恶意转换中提取水印签名来增强鲁棒性
同时引入一种优化的波束搜索算法来生成具有连贯性和一致性的内容。
通过REMARK-LLM,LLM所有者利用消息编码模块将二进制签名嵌入到LLM生成的文本中并获得带水印的分布。随后,优化的波束搜索算法将该模块分布的输出转换为带水印的文本,确保语义连贯性、坚定的语义保真度和成功提取签名。接下来,带水印的文本作为连贯的响应传播给最终用户。可以使用消息解码模块提取插入的签名来验证水印的存在。它将提取的消息与插入的签名进行比较,以确定LLM是否生成文本。

  • 模型效果
    在带有水印的内容中保留了语义完整性,同时确保有效的水印检索。对多个未见过的数据集进行的广泛评估凸显了REMARK-LLM与现有技术相比,他在同一文本中嵌入了更多签名位,同时保持了语义完整性。此外,REMARK-LLM对一系列水印检测和删除攻击表现出更好地弹性。
  • 现有的文本水印
    1、基于规则的水印
    基于规则的水印取代了同义词或转换句法结构插入段落作为水印。这些手动设计的特征使得插入的签名可以通过词分布或句法分析在统计上被移除。
    基于规则的水印通过操纵语言特征将水印集成到LLM生成的文本中,改变词汇属性,并替换同义词。基于规则的水印方法旨在将同义词替换或句法变换作为水印插入,同时确保整体语义不被
http://www.lryc.cn/news/516670.html

相关文章:

  • Android SPRD 工模测试修改
  • H3C CN3360B光纤存储交换机配置案例
  • 问题:Flask应用中的用户会话(Session)管理失效
  • Backend - C# 操作数据库 DB(ADO.NET、LINQ to SQL、EF)
  • JMeter + Grafana +InfluxDB性能监控 (二)
  • springCloud实战
  • 从优化算法到分布式训练-提升AI模型收敛速度的系统性分析【附核心实战代码】
  • 如何在 Windows 10/11 上录制带有音频的屏幕 [3 种简单方法]
  • 鸿蒙应用开发(2)
  • 单片机-LED点阵实验
  • 微服务-Nacos(注册中心)
  • 【Linux知识】shell编程知识科普
  • 小程序学习06——uniapp组件常规引入和easycom引入语法
  • 平安产险安徽分公司携手安徽中医药临床研究中心附属医院 共筑儿童安全防护网
  • C语言练习:求数组的最大值与最小值
  • c++ thread线程join、detach、joinable方法
  • 【算法刷题】leetcode hot 100 哈希篇
  • linux系统(ubuntu,uos等)连接鸿蒙next(mate60)设备
  • 支付宝实名认证
  • GO随想:GO的并发等待
  • kubernetes第五天
  • 扩散模型论文概述(三):Stability AI系列工作【学习笔记】
  • JVM调优,参数在哪里设置的?
  • 2024年最新Stable Diffusion 新手入门教程,安装使用及模型下载
  • Ubuntu 20.04安装gcc
  • IT运维的365天--024 闲置路由器关闭了dhcp,如何知道它的IP是啥
  • kaggle竞赛:纽约出租车行程时间NYC Taxi Trip Duration
  • Freemarker模板进行判空
  • C++ const关键字(八股总结)
  • Linux 清楚历史命令