记Vision Mamba在Pascal架构的显卡下训练出错的的解决办法

Vision Mamba在Pascal架构的显卡下训练会出现“CUDA error: no kernel image is available for execution on the device”的报错,如下图所示:

file

搜索引擎提示是因为服务器上的CUDA版本与包编译的CUDA版本不一致导致的,因此,下载了mamba-ssm和causal-conv1d的源代码手工编译,但仍未能解决。

后来,通过进一步查阅Github issue的相关提问,发现这个问题可能和显卡的架构有关,在老架构的显卡上普遍有这个报错,有大神指出mamba-ssm和causal-conv1d两个库都没有为compute_60编译代码,而compute_60缺少bf16的数据类型,所以会报错。

因此,我在这两个库的setup.py中添加了compute_60的编译指令,如下图所示,重新编译后,问题解决。
file
file

THE END