MinkowskiEngine安装(CUDA11.8+torch2.0.1+RTX4070TI)

news/2025/2/22 16:09:09

1、背景

1)因为项目要用这个库:MinkowskiEngine,Minkowski Engine — MinkowskiEngine 0.5.3 documentation

然后就用了之前安装好 MinkowskiEngine 的torch1.8.1,cuda11.1的环境。

2)自己的代码出现cuda不支持torch用gpu进行矩阵运算的情况。

现象是可以跑大部分程序,查看GPU使用情况也会显示大部分显存被用着。

但torch.det/inverse等计算矩阵就报错:

MAGMA error: function-specific error, see documentation (10) in magma_sgetrf_gpu_expert at /opt/conda/conda-bld/magma-cuda111_1605822518874/work/src/sgetrf_gpu.cpp:126

inverse_matrix = torch.inverse(matrix)

RuntimeError: cusolver error: 7, when calling cusolverDnCreate(handle)

然后查了不少,装个依赖库和magma库解决不了问题。

移到cpu上不报错,但这个项目类似计算不少,还是从根源解决问题吧。

然后大部分都说是cuda和torch版本不匹配。

然后我系统装了12.1和11.1的cuda,改为12.1的时候的虚拟环境是不报错的。但MinkowskiEngine 不能支持太高版本的cuda,目前我能查到的是11.8装成功的案例。

最后查到了一个东西,说明就是cuda11.1版本太低了。

https://en.wikipedia.org/wiki/CUDA#GPUs_supported

总结就是40系的显卡,最低装CUDA11.8

2、修改过程

安装CUDA11.8,

可参考https://blog.csdn.net/2201_75663877/article/details/145207222

更新旧版本选择no,更新已有软连接选择no。不装driver,不选最后一项kernel(这个是加速计算的,但选了会报错)。

这个时候系统有好几个版本的CUDA了,使用update-alternatives工具管理,update-alternatives链接到/usr/local/cuda,update-alternatives加进来所有cuda,这样每次改alternative的选择就可以了。gcc我也只如此管理https://blog.csdn.net/SimpleForest/article/details/144018234。

CUDA的环境变量只设置/usr/local/cuda就够了。

安装好后创建虚拟环境过程不再赘述。

3、安装准备

和cuda版本匹配的gpu版的torch等。

说明一下的是,我在虚拟环境中和base中都装了OpenBLAS和ninja,用户系统环境之前装过。因为用到了,但不知道具体用的哪里的。但不想在这费功夫。

4、安装过程及问题解决

MinkowskiEngine在cuda11.8中成功安装_minkowskiengine 11.8-CSDN博客

以上过程很简单,但实际中一般都会报错。

我报错,查GPT好像是CUDA的问题,但虚拟环境我都设置了,并且设置对了。前人也能在11.8上装,torch是gpu版且与cuda版本也都对应。

然后去查源文件。打开setup.py

比较清楚:--cuda_home都是可以编译的时候在终端输入的,,我检查了其它设置没啥问题,也不用特意设置,

if not (CUDA_HOME is False): # False when not set, str otherwise

    print(f"Using CUDA_HOME={CUDA_HOME}")

这个安装过程终端没有打印,说明还是没get到CUDA_HOME,原因未知

然后安装命令最后手动加上了CUDA_HOME路径

python setup.py install --blas_include_dirs=${CONDA_PREFIX}/include --blas=openblas --cuda_home=/usr/local/cuda

如果电脑一般,中间可能会闪退,按照其它教程改小140多行的MAX_COMPILATION_THREADS = 12就行,我这里改为4.

然后虽然会有很多warning,最后还是安成了,python测试暂时没问题。

2025年2月20


http://www.niftyadmin.cn/n/5862505.html

相关文章

2024系统编程语言风云变幻:Rust持续领跑,Zig与Ada异军突起

2024年系统编程语言调查报告新鲜出炉!这份报告对Rust、Zig、Ada、C、C等主流语言进行了全面评估,结果令人瞩目。Rust凭借其强大的类型系统和内存安全机制继续领跑,而Zig和Ada则展现出巨大的潜力,为系统编程领域带来了新的活力。本…

有没有使用wxpython开发的类似于visio或drawio的开源项目(AI生成)

有没有使用wxpython开发的类似于visio或drawio的开源项目 是的,有一些使用wxPython开发的类似于Microsoft Visio或draw.io(现为diagrams.net)的开源项目。wxPython 是一个跨平台的GUI工具包,它允许Python开发者创建桌面应用程序&…

【OS安装与使用】part6-ubuntu 22.04+CUDA 12.4运行MARL算法(多智能体强化学习)

文章目录 一、待解决问题1.1 问题描述1.2 解决方法 二、方法详述2.1 必要说明2.2 应用步骤2.2.1 下载源码并安装2.2.2 安装缺失的依赖项2.2.3 训练执行MAPPO算法实例 三、疑问四、总结 一、待解决问题 1.1 问题描述 已配置好基础的运行环境,尝试运行MARL算法。 1…

VMware NSX 4.X Professional V2(2V0-41.24)题库

What is the VMware recommended way to deploy a virtual NSX Edge Node? A. Through the NSX UI B. Through automated or interactive mode using an ISO C. Through the vSphere Web Client D. Through the OVF command line tool 答案: A 解析:Install NSX Ed…

C++ 设计模式 - 策略模式

一:概述 策略模式是一种行为设计模式,来源于《设计模式:可复用面向对象软件的基础》一书。它定义了一组算法,并将它们封装成独立的对象。策略模式在标准模板库(STL)中被广泛使用。 二:策略模式…

NeurIPS-2024 | 具身智能如何理解空间关系?SpatialRGPT:视觉语言模型中的具象空间推理

作者:An-Chieh Cheng, Hongxu Yin, Yang Fu, Qiushan Guo, Ruihan Yang, Jan Kautz, Xiaolong Wang, Sifei Liu 单位:加州大学圣地亚哥分校,NVIDIA 标题:SpatialRGPT: Grounded Spatial Reasoning in Vision-Language Models 原…

5G-A的尔滨故事,冰雪下的科技春潮

刚刚结束的第九届亚冬会中,黑科技5G-A达成了刷屏级的效果。这也是5G-A首次大规模服务于国际大型体育赛事。 一场冰雪盛会之后,5G-A向何处去?这个黑科技的能力,将如何投放给大众消费者和企业?这是值得我们进一步思考的话…

GlusterFS卷管理实战指南:从扩展卷到自我修复,全面掌握高效运维技巧

#作者:闫乾苓 文章目录 1 扩展卷2 收缩卷3 更换故障brick3.1 更换纯分布式中的brick3.2 更换复制/分布式复制卷中的brick 4 重新平衡卷4.1 重新平衡卷以修复布局变化4.2 重新平衡卷以修复布局并迁移现有数据4.3 显示重新平衡操作的状态4.4 停止正在进行的重新平衡操…