Ich habe die Arbeit aufgezeichnet, als CUDA und cuDNN, die der Version von Tensorflow entsprechen, lokal für maschinelles Lernen mit Tensorflow installiert wurden.
In diesem Artikel wurden CUDA 10.1 und cuDNN 7.6 für die Verwendung von Tensorflow 2.3.0 eingerichtet.
Ubuntu 20.04
https://codelabo.com/posts/20200229081221
https://medium.com/@exesse/cuda-10-1-installation-on-ubuntu-18-04-lts-d04f89287130
--1: Installation des NDIVIA-Treibers -2: CUDA-Setup --3: cuDNN-Setup
Finden Sie heraus, welche CUDA- und cuDNN-Version Sie für die Version von Tensorfow benötigen, die Sie verwenden möchten. Sie können dies auf der [offiziellen Website] von tensorfow (https://www.tensorflow.org/install/source) überprüfen.
Bei der Installation von CUDA wird das CUDA-Toolkit installiert. Verwechseln Sie CUDA nicht mit dem CUDA-Toolkit.
Nur die neueste Version von cuda kann vom regulären Download auf der offiziellen Website heruntergeladen werden. Laden Sie sie daher aus dem Archiv herunter.
Sie können die Version, die Sie herunterladen möchten, unter NVIDIA CUDA Archived Documentation auswählen. Klicken Sie hier, um die Dokumentation für jede Version anzuzeigen (https://docs.nvidia.com/cuda/archive/).
Wählen Sie die gewünschte CUDA aus den archivierten Versionen aus
CUDA 10.1
Select Target Platform
Linux
Architecutre
x86_64
Distribution
Ubuntu
Version
18.04
Installer Type
runfile [local]
Führen Sie den Befehl wget aus, der in den obigen Auswahlelementen im Terminal überprüft wurde.
wget http://developer.download.nvidia.com/compute/cuda/10.1/Prod/local_installers/cuda_10.1.243_418.87.00_linux.run
Die offizielle Dokumentation Kurzanleitung vor dem Ausführen des Installationsprogramms Da die erforderlichen Arbeiten aufgelistet sind, führen Sie sie nacheinander aus.
--Bestätigungsbefehl
#Überprüfen Sie, ob der Jugendstil geladen ist(Wenn nichts herauskommt, müssen Sie möglicherweise die Ungültigmachungsarbeit nicht ausführen)
$ lsmod | grep nouveau
in etc / modprobe.d / blacklist-nouveau.conf
blacklist nouveau
options nouveau modeset=0
Beschreiben und anpassen.
$ cd /etc/modprobe.d
$ sudo touch blacklist-nouveau.conf
$ sudo chmod 777 blacklist-nouveau.conf
$ echo blacklist nouveau > blacklist-nouveau.conf
$ echo options nouveau modeset=0 >> blacklist-nouveau.conf
$ cat blacklist-nouveau.conf #Überprüfen Sie den Inhalt
Kernel-Initramfs neu generieren
sudo update-initramfs -u
--3 Mehrbenutzermodus (Textanmeldung) --5 Mehrbenutzermodus (grafische Anmeldung)
Überprüfen Sie den aktuellen Laufpegel
$ runtime
N 5
$ systemctl set-default multi-user.target
$ systemctl set-default graphical.target
Wenn es auch nach dem Verschieben nicht angezeigt wird, wird empfohlen, das Grub-Menü so einzustellen, dass es bei jedem Start angezeigt wird. Grub-Menü So löschen Sie: https://qiita.com/ricrowl/items/1d038d6b4412feedb25e
Runlevel 3 bedeutet, dass Xserver nicht gestartet wird. Nomodeset blockiert das Laden des Nouveau-Moduls. Dies ermöglicht das Laden des NVIDIA-Moduls nach dem Build.
$ sudo nvidia-xconfig
Als ich danach neu startete, verschwand das HDMI-Signal von Mazabo. Stellen Sie eine Verbindung zu anderen Videoanschlüssen der GPU her. Ich habe die Bedeutung dieses Befehls nicht untersucht, daher muss ich ihn später untersuchen.
Die vorhandene gcc-Version 9.3 wird unterstützt, sodass die neueste gcc-Version beim Ausführen von .run einen Fehler verursacht
udo apt -y install gcc-8 g++-8
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-8 8
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-8 8
Referenz: https://askubuntu.com/questions/1236188/error-unsupported-compiler-version-9-3-0-when-installing-cuda-on-20-04 In der Tensorflow-Dokumentation wird gcc 7.3.1 empfohlen, aber ich könnte es mit gcc 8 ausführen.
sudo sh cuda_10.1.243_418.87.00_linux.run #--silent
Wenn Sie .run ausführen, haben Sie die Möglichkeit, auch den versino.418-Treiber zu installieren. Wenn Sie es mit der Option --silent in der Kurzanleitung ausführen, wird der Treiber für versino.418 automatisch installiert, sodass aufgrund eines Konflikts mit dem zuvor installierten Treiber ein Fehler auftritt. Ohne Optionen ausführen.
echo -e "\n## CUDA and cuDNN paths" >> ~/.bashrc
echo 'export PATH=/usr/local/cuda-10.1/bin${PATH:+:${PATH}}' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda-10.1/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}' >> ~/.bashr
source ~/.bashrc
nvcc -V