Решение проблем с GPU¶
В этой статье
После обновления драйверов или ПО в Ubuntu возникает ошибка NVML: Driver/library version mismatch¶
Если после установки вы столкнулись с ошибкой вида Failed to initialize NVML: Driver/library version mismatch, то необходимо переподключить модули ядра Nvidia, удалив их и запустив заново nvidia-smi для переинициализации:
sudo rmmod -f nvidia-modeset
sudo rmmod nvidia_uvm
sudo rmmod nvidia_drm
sudo rmmod nvidia-peermem
sudo rmmod nvidia
sudo nvidia-smi
Также ошибка может возникать из-за переполнения раздела /boot
при одновременном обновлении ядра системы и невозможности сборки новых инициализационных RAM-дисков (initrd) с модулями видеокарты. Для ее исправления воспользуйтесь данной инструкцией.
Если ошибка не исчезает, то рекомендуем удалить пакеты драйверов Nvidia:
и переустановить их (и CUDA) заново.
При установке драйверов Nvidia не компилируются модули ядра¶
Если при установке драйверов Nvidia у вас появляется ошибка вида:
# command: 'make' -j128 KERNEL_UNAME=6.8.0-64-generic IGNORE_CC_MISMATCH=1 SYSSRC=/lib/modules/6.8.0-64-generic/build LD=/usr/bin/ld.bfd CONFIG_X86_KERNEL_IBT= modules
Makefile:63: WARNING: Unable to locate the compiler x86_64-linux-gnu-gcc-12 from CONFIG_CC_VERSION_TEXT in the kernel configuration.
make[1]: Entering directory '/usr/src/linux-headers-6.8.0-64-generic'
warning: the compiler differs from the one used to build the kernel
The kernel was built by: x86_64-linux-gnu-gcc-12 (Ubuntu 12.3.0-1ubuntu1~22.04) 12.3.0
You are using: cc (Ubuntu 11.4.0-1ubuntu1~22.04) 11.4.0
SYMLINK /var/lib/dkms/nvidia/575.57.08/build/nvidia/nv-kernel.o
SYMLINK /var/lib/dkms/nvidia/575.57.08/build/nvidia-modeset/nv-modeset-kernel.o
значит у вас не установлен GCC 12-й версии. Установите его командой
и переустановить их (и CUDA) заново.
При установке драйверов NVIDIA появляется ошибка невозможности подписать модули ядра¶
При установке драйверов видеокарты у вас может появится ошибка, что система не может найти пакет update-secureboot-policy
и подписать модули, хотя Secure Boot у вас отключен в BIOS:
Building initial module nvidia/575.57.08 for 6.8.0-64-generic
Sign command: /usr/bin/kmodsign
Binary update-secureboot-policy not found, modules won't be signed
Для решения данной проблемы установите пакет shim-signed
командой
и переустановить их (и CUDA) заново.