深度學習常需要使用GPU進行運算,這邊使用 Ubuntu 18.04 安裝
確認作業系統版本
輸入 lsb_release
-a 確認為 Ubuntu 18.04 版本
ubuntu@ubuntu-Z390-M:~$ lsb_release -a
No LSB modules are available.
Distributor ID: Ubuntu
Description: Ubuntu 18.04.5 LTS
Release: 18.04
Codename: bionic
安裝 Nvidia driver
清除原有的nvidia driver
sudo apt-get purge nvidia*
加入顯卡 ppa
sudo add-apt-repository ppa:graphics-drivers
package 更新
sudo apt-get update
sudo apt upgrade
找出目前支援的GPU driver 版本
ubuntu-drivers list
安裝 nvidia driver
sudo apt install nvidia-driver-VERSION_NUMBER_HERE
使用455版本
sudo apt install nvidia-driver-455
安裝完後重啟
sudo reboot
檢查是否安裝成功
nvidia-smi

安裝 CUDA
驅動安裝完畢後確認 CUDP 11.1 已正常安裝,此步驟略過
安裝 cuDNN
先登入nvidia cudnn安裝官網,同意使用者條款,後選擇ubuntu18.04版本安裝cudnn下載。
使用 dpkg -i <file_name> 執行安裝
安裝 cuDNN runtime library
sudo dpkg -i ./libcudnn8_8.0.5.39-1+cuda11.1_amd64.deb
安裝 pytorch
pip3 install torch==1.7.1+cu110 torchvision==0.8.2+cu110 torchaudio===0.7.2 -f https://download.pytorch.org/whl/torch_stable.html
測試是否使用 GPU
>>> import torch
>>> a = torch.cuda.is_available()
>>> print(a)
True
>>>
>>> ngpu= 1
>>> # Decide which device we want to run on
... device = torch.device("cuda:0" if (torch.cuda.is_available() and ngpu > 0) else "cpu")
>>> print(device)
cuda:0
>>> print(torch.cuda.get_device_name(0))
GeForce GTX 1070
>>> print(torch.rand(3,3).cuda())
tensor([[0.8765, 0.3457, 0.3078],
[0.5144, 0.8105, 0.3253],
[0.9359, 0.3266, 0.6643]], device='cuda:0')
確認成功,相較於使用 TensorFlow 需要對應 cuda 版本,pytorch 容易許多