внутри контейнера LXC не обнаружено устройств, поддерживающих CUDA

я последовал за инструкции и прочитайте официальное руководство подробно, чтобы настроить Cuda внутри контейнера LXC.

когда я пытаюсь выполнить пример ./ deviceQuery скрипт из официальных примеров кодов я получаю пропуск в узле. Однако при выполнении скрипта в контейнере я получаю следующую ошибку:

$ ./deviceQuery 
./deviceQuery Starting...

 CUDA Device Query (Runtime API) version (CUDART static linking)

cudaGetDeviceCount returned 38
-> no CUDA-capable device is detected
Result = FAIL

Cuda распознан и установлен внутри контейнер:

$ nvcc --version
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2015 NVIDIA Corporation
Built on Tue_Aug_11_14:27:32_CDT_2015
Cuda compilation tools, release 7.5, V7.5.17

устройства nVidia монтируются внутри хоста и контейнера LXC:

$ ls -l /dev/nvidia*
crw-rw-rw- 1 root root 195,   0 Dec 20 23:31 /dev/nvidia0
crw-rw-rw- 1 root root 195, 255 Dec 20 23:31 /dev/nvidiactl
crw-rw-rw- 1 root root 246,   0 Dec 20 23:31 /dev/nvidia-uvm

когда я запускаю sudo nvidia-smi внутри контейнера Я получаю следующее сообщение об ошибке:

Failed to initialize NVML: Unknown Error

как я могу сделать устройство внутри контейнера?

linux / index.HTML-код

8
задан Greg
26.04.2023 12:51 Количество просмотров материала 2606
Распечатать страницу

1 ответ

у меня была такая же проблема, о которой я подробно писал здесь.

проблема, которую вы испытываете, может быть вызвана использованием шаблона LXC, который не соответствует вашему хосту. Я использую Proxmox 4.4, который основан на Debian 8.6. Мой контейнер был основан на Ubuntu 16.04. Как и вы, я видел переданные узлы в контейнере с root как владелец и группа, а не никто:nogroup как и ожидалось.

на форум пост я споткнулся на вдохновил меня на создание нового контейнера на основе шаблона, подходящего моему хосту, Debian 8.6. Однажды я сделал это /dev узлы, принадлежащие nobody:nogroup и nvidia-smi правильно определил мой GPU.

Если у вас не совпадают, я настоятельно рекомендую вам попробовать сделать их матч - единственный способ я знаю, чтобы восстановить его.

1
отвечен elBradford 2023-04-27 20:39

Постоянная ссылка на данную страницу: [ Скопировать ссылку | Сгенерировать QR-код ]

Ваш ответ

Опубликуйте как Гость или авторизуйтесь

Имя
Вверх