当前位置: 首页 > news >正文

[论文泛读]zkLLM: Zero Knowledge Proofs for Large Language models

文章目录

  • 介绍
  • 实验数据
    • 实验数据1
    • 实验数据2
    • 实验数据3

介绍

这篇文章发在CCS2024,CCS是密码学领域的顶会。作者是来自加拿大的University of Waterloo。文章对大语言模型像GPT和LLM等大语言模型实现了零知识可验证执行,但不涉及零知识可验证训练。个人觉得这是一篇值得精读的一篇文章。文章的方案与现存的RISC-ZERO和EZKL或者Halo2的方案(zkML)不同。文中使用完全并行化的 CUDA ,同时对于拥有 130 亿个参数的 LLM,这篇文章的方法能够在 15 分钟内为整个推理过程生成正确性证明。生成的证明大小不到 200 kB。(使用ezkl的方案使用nanoGPT参数大概40w实现零知识可验证执行所需要的时间2小时,而这篇论文的方案有着质的提升)。

实验数据

实验数据1

在这里插入图片描述
论文中分别对大语言模型进行证明生成的时间,证明大小以及验证时间进行了测量。

实验数据2

在这里插入图片描述
论文中与zkML的生成证明的时间进行了比较,zk LLM方案的生成证明的时间远远低于zkML生成证明的时间。zkML这个方案是基于halo2的方案。

实验数据3

在这里插入图片描述
该实验研究了Sequence Length对生成证明的时间,生成证明的大小,以及验证时间的影响。Sequence Length是模型输入文本的长度。

http://www.lryc.cn/news/420217.html

相关文章:

  • vscode插件中的图标怎么设置
  • Study--Oracle-08-oracle数据库的闪回技术
  • 获取客户端真实IP
  • 韩式告白土味情话-柯桥生活韩语学习零基础入门教学
  • Linux安全与高级应用(一)深入探讨Linux安全与高级应用
  • 【nginx 第二篇章】各个环境安装 nginx
  • 在Spring Boot和MyBatis-Plus项目中,常见的错误及其解决方法2.0
  • 招聘信息数据清洗
  • 机器学习——支持向量机(SVM)(1)
  • Elastic Observability 8.15:AI 助手、OTel 和日志质量增强功能
  • Unity3D ECS架构的优缺点详解
  • 理解Go语言中多种并发模式
  • C++ primer plus 第17 章 输入、输出和文件:文件输入和输出03:文件模式:二进制文件
  • 网络安全之sql靶场(11-23)
  • WordPress网站被入侵,劫持收录事件分析
  • 原生js: 实现三个水平tab按钮, 默认第一个上面有class, 点击另外的实现class=‘cur‘的切换的效果
  • C#语言基础速成Day07
  • jvm运行时常量池溢出的原因
  • floyd算法详解
  • Web前端性能优化的方向
  • 【面试题】设计模式-责任链模式
  • JavaEE 第8节 单例模式详解
  • OpenAI 发布 GPT-4o 模型安全评估报告:风险等级为“中等”|TodayAI
  • 学习前端面试知识
  • Leetcode JAVA刷刷站(9)回文数
  • 数据结构算法
  • WordPress个性化站点
  • GESP C++ 2024年03月一级真题卷
  • Linux驱动开发基础(Hello驱动)
  • centos7安装 ES集群 elasticsearch