2023-10-17 (Tue)

CUDA と GPU driver 更新

クラスタに oneAPI for NVIDIA を入れようとする → CUDA 12.x が必要なので CUDA 12.2 を入れようとする → NVIDIA driver が 510 じゃだめで 535 にする必要がある → kernel が 5.4 じゃだめで 5.15 にする必要がある → apt-get install がいろいろ conflict を起こす……

で発狂していたが、最終的に nvidia-driver-510 を除去したあとに apt-get autoremove することで、一緒に入ったバージョン 510 関係のパッケージが削除され、535 がすんなり入ることが分かった。

また、カーネル更新もできた。5.4 系列が 20.04 LTS の本来のバージョンで、5.15 は 22.04 LTS から backport されたもので HWE (hardware enhancement) として配布されているようだ。

読んだ