NVIDIA Container Toolkit
问题描述
在早期深度学习尚未普及时,Docker 作为一种容器技术是不支持调用宿主机 GPU 的,后面在 Docker 官方以及 NVIDIA 的推动下才得以支持,这其中的关键就在于 NVIDIA Container Toolkit。
通常有两种情况可能会需要 NVIDIA Container Toolkit:
- 主动:需要 Docker 容器调用 GPU
- 被动:遇到报错
# docker: Error response from daemon: could not select device driver ““ with capabilities: [[gpu]].
安装
首先,需要装好 NVIDIA 显卡驱动。然后配置仓库:
1 | curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg |
上述指令切记分两条分别执行,否则会出现看似添加了源但其实没有添加上的尴尬情况。
完成后,更新并安装 NVIDIA Container Toolkit 软件包:
1 | sudo apt update |
安装完成后,记得重启 Docker:
1 | sudo systemctl restart docker |
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 日勿の部落格!