当前位置: 首页 > news >正文

windows mamba-ssm环境配置指南

写在前面

本文记录本人在复现mamba-ssm中遇到的所有问题。

创建虚拟环境

无论你的电脑是什么显卡,cuda11还是12,都需要创建虚拟环境。

conda create -n your_env python=3.10.13
conda activate your_env
conda install cudatoolkit==11.8 -c nvidia
conda install torch==2.1.1 torchvision==0.16.1 torchaudio==2.1.1 --index-url https://download.pytorch.org/whl/cu118
conda install -c "nvidia/label/cuda-11.8.0" cuda-nvcc
conda install packaging

安装 triton

triton 在此处下载 https://hf-mirror.com/datasets/ArrayCats/triton-2.0.0-cp310-cp310-win_amd64/tree/main
然后

conda install packaging

下载mamba到本地

mamba-ssm
修改 setup.py 文件

FORCE_BUILD = os.getenv("MAMBA_FORCE_BUILD", "FALSE") == "TRUE"
SKIP_CUDA_BUILD = os.getenv("MAMBA_SKIP_CUDA_BUILD", "FALSE") == "TRUE"# 修改为:
FORCE_BUILD = os.getenv("MAMBA_FORCE_BUILD", "FALSE") == "FALSE"
SKIP_CUDA_BUILD = os.getenv("MAMBA_SKIP_CUDA_BUILD", "FALSE") == "FALSE"

修改 mamba_ssm/ops/selective_scan_interface.py

def selective_scan_fn(u, delta, A, B, C, D=None, z=None, delta_bias=None, delta_softplus=False,return_last_state=False):"""if return_last_state is True, returns (out, last_state)last_state has shape (batch, dim, dstate). Note that the gradient of the last state isnot considered in the backward pass."""return SelectiveScanFn.apply(u, delta, A, B, C, D, z, delta_bias, delta_softplus, return_last_state)def mamba_inner_fn(xz, conv1d_weight, conv1d_bias, x_proj_weight, delta_proj_weight,out_proj_weight, out_proj_bias,A, B=None, C=None, D=None, delta_bias=None, B_proj_bias=None,C_proj_bias=None, delta_softplus=True
):return MambaInnerFn.apply(xz, conv1d_weight, conv1d_bias, x_proj_weight, delta_proj_weight,out_proj_weight, out_proj_bias,A, B, C, D, delta_bias, B_proj_bias, C_proj_bias, delta_softplus)# 修改为:
def selective_scan_fn(u, delta, A, B, C, D=None, z=None, delta_bias=None, delta_softplus=False,return_last_state=False):"""if return_last_state is True, returns (out, last_state)last_state has shape (batch, dim, dstate). Note that the gradient of the last state isnot considered in the backward pass."""return selective_scan_ref(u, delta, A, B, C, D, z, delta_bias, delta_softplus, return_last_state)def mamba_inner_fn(xz, conv1d_weight, conv1d_bias, x_proj_weight, delta_proj_weight,out_proj_weight, out_proj_bias,A, B=None, C=None, D=None, delta_bias=None, B_proj_bias=None,C_proj_bias=None, delta_softplus=True
):return mamba_inner_ref(xz, conv1d_weight, conv1d_bias, x_proj_weight, delta_proj_weight,out_proj_weight, out_proj_bias,A, B, C, D, delta_bias, B_proj_bias, C_proj_bias, delta_softplus)

最后

pip install .

import selective_scan_cuda 问题

“下载mamba到本地” 中的 代码修改 均已完成,直接注释爆红的 import selective_scan_cuda 即可

# import selective_scan_cuda

其他疑难杂症

cuda available False

此处详细检查自己condo环境的torch是否为cu11.8
在命令行进行下面操作

conda activate your_env
python

粘贴下面命令

import torch
print(torch.__version__)
print(torch.cuda.is_available())

查看是否为False,若为false,卸载torch,重新进行上面步骤。

conda uninstall torch
conda install torch==2.1.1 torchvision==0.16.1 torchaudio==2.1.1 --index-url https://download.pytorch.org/whl/cu118

Numpy问题

RuntimeError: Numpy is not available
AttributeError: module ‘numpy’ has no attribute ‘ndarray’

如果出现Numpy问题,这里没有记录问题图片,读者可以尝试降低numpy为这个版本,可以解决(卸载重装可能会有问题,建议重新安装即可)

conda install numpy=1.23.5
http://www.lryc.cn/news/606976.html

相关文章:

  • 在 Docker 中启动 Nginx 并挂载配置文件到宿主机目录
  • 代码随想录算法训练营第三十八天
  • Mermaid流程图可视化系统:基于Spring Boot与Node.js的三层架构实现
  • h5独立部署
  • (转)mybatis和hibernate的 缓存区别?
  • AG-UI 协议全面解析--下一代 AI Agent 交互框架医疗应用分析(上)
  • 【BUUCTF系列】[GXYCTF2019]Ping Ping Ping 1
  • 智能体的未来:AGI路径上的关键技术突破
  • springboot助农平台
  • 探索 VMware 虚拟机:开启虚拟化世界的大门
  • 人大金仓数据库Kingbase主备集群搭建和部署
  • Spring Boot 2.1.18 集成 Elasticsearch 6.6.2 实战指南
  • 工业环境中无人叉车安全标准深度解析
  • 我用提示词A 对qwen3-4b大模型进行 nl2sql 任务 grpo 强化学习,评估的时候换新提示词,会影响nl2sql测评准确率吗?
  • 数据结构常见时间复杂度整理
  • 数据结构(10)栈和队列算法题
  • 4-verilog简单状态机
  • Linux 硬盘分区管理
  • FEVER数据集:事实验证任务的大规模基准与评估框架
  • spring boot 启动报错---java: 无法访问org.springframework.boot.SpringApplication 错误的类文件
  • Pycaita二次开发基础代码解析:几何体重命名与参数提取技术
  • 【Java面试题】缓存穿透
  • 梯度下降的基本原理
  • Oracle EBS ERP开发 — 抛出异常EXCEPTION书写规范
  • Vue3 setup、ref和reactive函数
  • ReAct模式深度解析:构建具备推理能力的AI智能体架构
  • 【Linux】System V - 责任链模式与消息队列
  • 机密计算与AI融合:安全与智能的共生架构
  • 动态爱心树
  • Linux(CentOS 7.9) 卸载、安装MySql 5.7详细步骤教程,包括密码设置、字符集设置等