当前位置: 首页 > news >正文

调试bug记录

文章目录

  • 代码调试bug记录
    • 第一次计算
    • 第二次计算

代码调试bug记录

这应该是踩到什么大坑了…
之前没有怎么深度调试过LLM,这次本来想做一个可解释性实验,想着能不能看看输入到LLM中的token每个贡献度如何,就采用了积分梯度计算。

第一次计算

我的输入token是包括四个部分:

  • BLIP token
  • SlowFast token
  • Swin3D token
  • Text token

最后输出的就是这四个部分token的梯度贡献:

  • BLIP: -0.0053
  • Swin3D: 0.1027
  • SlowFast: 0.3611

但我想能不能具体看到每个token对结果的贡献度

第二次计算

我的输出相当于每个token,输出的格式是一个类似表格的结果

--- 每个Token的详细贡献度 ---type      token  contribution
0     Text          T      0.001234
1     Text          he     0.002345
...
8     Text          :      0.000123
9     BLIP    Token_0     -0.000567
10    BLIP    Token_1      0.001789
...
16    BLIP    Token_7     -0.000987
17    Text          .      0.000012
...

但是跑出来发现所有的contri都是NaN…
然后问大模型说是可能FP16溢出了,可以试试用FP32,然后我就照做,发现肯定是不可以的,因为一定会爆显存。
当我改回来的时候发现:

CUDA Setup failed despite CUDA being available. Please run the following command to get more information:python -m bitsandbytesInspect the output of the command and see if you can locate CUDA libraries. You might need to add them
to your LD_LIBRARY_PATH. If you suspect a bug, please take the information from python -m bitsandbytes
and open an issue at: https://github.com/bitsandbytes-foundation/bitsandbytes/issues

好像是cuda出问题了…
看看后续怎么解决吧,明天打算修复一下环境试试。

http://www.lryc.cn/news/590166.html

相关文章:

  • 【基于飞浆训练车牌识别模型】
  • Docker——Redis
  • 【C语言网络编程】HTTP 客户端请求(发送请求报文过程)
  • Mybatis07-缓存
  • 比特币技术简史 第二章:密码学基础 - 哈希函数、公钥密码学与数字签名
  • 今日行情明日机会——20250716
  • S7-200 SMART PLC:模拟量模块接线全解析
  • 汽车功能安全-相关项集成和测试(系统集成测试系统合格性测试)-12
  • xss-labs通关
  • “Datawhale AI夏令营”基于带货视频评论的用户洞察挑战赛2
  • lesson15:Python的文件操作
  • Docker 中的动态配置:docker update 命令与环境变量管理
  • Hadoop架构演进:从1.0到2.0的深度对比与优化解析
  • Docker 安装和配置 MySQL 8.0.36 的详细步骤
  • 力扣-146.LRU缓存机制
  • Linux-局域网构建+VLAN 划分 + 端口 MAC-IP 绑定 + 静态 DHCP
  • 【前端】在Vue3中绘制多系列柱状图与曲线图
  • (nice!!!)(LeetCode 每日一题) 3201. 找出有效子序列的最大长度 I (动态规划dp)
  • 产品经理笔试考试回忆集(2025湖南某国企)
  • 电力政策解读:山东电网新型储能集中调用的能源管理系统实现点
  • 百炼Agent MCP与IoT实战(二):阿里云MQTT Broker配置
  • arm版本的ubuntu安装git或者vim等方法
  • TypeScript的export用法
  • Linux LVS集群技术详解与实战指南
  • Vue + React 联合开发指南:跨越框架边界的前端实践
  • 第二章【vue】基础(超详细)
  • 佰力博检测与您探讨高温压电d33测试的操作步骤与选购建议
  • go项目实战
  • 自学中医笔记(一)
  • PowerBI实现仅在需要图表时显示图表