当前位置: 首页 > news >正文

第27期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练Transformer(GPT)、人工智能生成内容(AIGC)以及大型语言模型(LLM)等安全领域应用的知识。在这里,您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令(Prompts)。现为了更好地知悉近一周的贡献内容,现总结如下。

Security Papers

1. 使用大型语言模型从隐私保护屏蔽中恢复

简介:在这项研究中,研究者提出了多种基于LLM的预训练和微调方法,并对各种数据集进行了实证研究。实验结果表明,在没有隐私保护的情况下,在模糊语料库上训练的模型能够获得与在原始数据上训练的算法相当的性能

链接:

https://arxiv.org/pdf/2309.08628.pdf

2. Hide and Seek (HaS):快速隐私保护的轻量级框架

简介:在本文中,研究者通过训练一个小的局部模型来匿名化LLM的返回结果,从而扩展了匿名化技术的应用场景。本文中以HaS框架为例,为了定量评估HaS的隐私保护性能,研究者提出了黑盒和白盒对抗性模型。通过实验结果表明,HaS框架实现了隐私保护和效用之间的最佳平衡。

链接:

https://arxiv.org/pdf/2309.03057.pdf

3. 大语言模型驱动的智能合约漏洞检测:新视角

简介:本文系统分析了利用GPT-4等大型语言模型挖掘智能合约漏洞的机会、挑战和潜在解决方案。对于智能合约漏洞检测任务,实现实际可用性取决于识别尽可能多的真实漏洞,同时最大限度地减少误报数量。尽管如此,研究者仍有更矛盾的发现,为此他们提出了一种称为GPTLENS的对抗性框架,它将传统的一阶段检测分解为两个协同阶段——生成和区分,用于渐进检测和细化,其中LLM分别扮演两个角色,即AUDITOR和CRITIC。实验结果和示例表明,AUDITOR和CRITIC协同工作,比传统的一阶段检测有显著的改进。

链接:

https://arxiv.org/pdf/2310.01152.pdf

4. HuntGPT:将基于机器学习的异常检测和可解释的人工智能与大型语言模型(LLM)集成

简介:在这项研究中,研究者介绍了HuntGPT的开发,这是一个专门的入侵检测仪表板。该工具集成了SHAP和Lime等XAI框架,增强了模型的用户友好性和直观性。当与GPT-3.5 Turbo对话代理相结合时,HuntGPT旨在以易于解释的格式提供检测到的威胁,强调用户理解并提供流畅的交互体验。研究结果表明,以LLM技术为基础并与XAI集成的会话代理可以实现生成可解释和可操作的人工智能解决方案的arobust机制,特别是在入侵检测系统领域。

链接:

https://arxiv.org/pdf/2309.16021.pdf

5. 红队游戏:红队语言模型的博弈论框架

简介:本文提出了一种无需人工注释的通用算法框架——红队博弈(RTG)。RTG是为分析红队语言模型(RLM)和蓝队语言模型(BLM)之间的多回合攻防交互而设计的。在RTG中,研究者提出了具有语义空间多样性度量的游戏化红队求解器(GRTS)。GRTS是一种自动化红队技术,通过元博弈分析将RTG求解到纳什均衡,这与RLM和BLM理论保证的优化方向相对应。基于RLM的多回合攻击实验结果表明,GRTS能够自主发现多种攻击策略,有效提高了LLM的安全性。总的来说,RTG已经为团队任务建立了一个基本框架,并构建了一种新的可伸缩的对齐监督技术。

链接:

https://arxiv.org/pdf/2310.00322.pdf 

http://www.lryc.cn/news/228506.html

相关文章:

  • 大数据-玩转数据-Flume
  • 【Linux】进程概念IV 进程地址空间
  • Flink在汽车行业的应用【面试加分系列】
  • 智慧工地源码:助力数字建造、智慧建造、安全建造、绿色建造
  • Spring Boot(二)
  • 上海亚商投顾:沪指缩量调整跌 高位强势股继续退潮
  • 药理学试卷
  • SpringBoot3-快速入门
  • 具名挂载和匿名挂载
  • ARM串口
  • C++ Qt 学习(文章链接汇总)
  • 2311d9月会议
  • 《算法通关村——二分查找在旋转数字中的应用》
  • C/S架构学习之基于TCP的本地通信(服务器)
  • 乡镇村污水处理智慧水务智能监管平台,助力污水监管智慧化、高效化
  • OSPF综合
  • vue分片上传视频并转换为m3u8文件并播放
  • 【MySQL】对表结构进行增删查改的操作
  • Hadoop原理,HDFS架构,MapReduce原理
  • 【Spring Boot】035-Spring Boot 整合 MyBatis Plus
  • Hafnium之强制性的接口
  • 计算机视觉:使用opencv实现银行卡号识别
  • 【Proteus仿真】【Arduino单片机】简易计算器设计
  • pychon/PIL/opencv/json学习过程中遇到的问题
  • YOLO目标检测——番茄数据集下载分享【含对应voc、coco和yolo三种格式标签】
  • (JAVA)线程
  • 【深度学习环境】windows安装 NVIDIA Docker
  • 【微信小程序】自定义组件(三)
  • Python语言:经典案例分析讲解2
  • dbeaver连接别人的数据库没有表