配置深度学习环境
本帖最后由 Handsome_zhou 于 2023-12-11 14:45 编辑gcc,cmake之类的编译工具一键安装:apt install build-essential
安装显卡驱动:sudo ubuntu-drivers autoinstall
配置过程首先看你所装的显卡驱动版本。
查看GPU使用情况:nvidia-smi
查看GPU型号:lspci | grep -i nvidia
查看cuda的版本:nvcc -V
查看cudnn版本:cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2 #有结果就安装成功
查看NVIDIA驱动版本:1.sudo dpkg --list | grep nvidia-*
2.cat /proc/driver/nvidia/version
查看驱动对应的CUDA版本参考这个链接:https://blog.csdn.net/qq_39779233/article/details/127203373
win10查看显卡支持的cuda版本:打开nvidia控制面板,点击系统信息。
ubuntu查看cuda版本:1.cat /usr/local/cuda/version.txt
2.nvidia-smi这个指令是查询显卡使用情况的,但是也会附带cuda版本信息。
两种方法反馈结果不同是因为驱动API和运行API的区别,配置深度学习环境时建议参考方法1的结果。
参考这个链接对GCC升级:https://blog.csdn.net/u010801439/article/details/80483036
显卡驱动安装:1.检测NVIDIA图形卡和推荐的驱动程序:ubuntu-drivers devices
2.gcc, cmake之类的编译工具一键安装: apt install build-essential
3.安装所有推荐的驱动:sudo ubuntu-drivers autoinstall
或者安装其中一个驱动:例如:sudo apt install nvidia-384
4.驱动安装完成,重新启动。
cuda官网下载需要的版本及其补丁。
Base installer安装命令: sudo sh cuda_9.1.85_387.26_linux.run
3个或4个补丁安装命令:sudo sh cuda_9.1.85.1_linux.run
sudo sh cuda_9.1.85.2_linux.run
sudo sh cuda_9.1.85.3_linux.run
cuda安装完毕,将下面两条加入.bashrc文件中
sudo vim ~/.bashrc
export PATH=/usr/local/cuda-9.1/bin/${PATH:+:${PATH}} #根据自己的版本,修改cuda-9.2/9.0...
export LD_LIBRARY_PATH=/usr/local/cuda-9.1/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
使环境变量生效:source ~/.bashrc
到这cuda安装完成。
下载对应的cuDNN,安装对应的cuDNN:
1.解压.tgz压缩包
解压到当前文件夹:tar zxvf 文件名.tgz -C ./
解压到指定文件夹:tar zxvf 文件名.tgz -C /指定路径
2.复制cuDNN内容到cuda指定文件夹内
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
cudnn安装完成。
到自己电脑 ~/NVIDIA_CUDA-9.0_Samples/文件夹下测试cuda完整性: cd /home/xxx/NVIDIA_CUDA-9.0_Samples #由自己电脑目录决定
sudo make #编译成功,显示:Finished building CUDA samples
进入目录:cd /home/xxx/NVIDIA_CUDA-9.0_Samples/bin/x86_64/linux/release
sudo ./deviceQuery#若CUDA安装且配置成功,提示Result = PASS,若失败 Result = FAIL
Result = Pass 则测试通过。
或者在python下执行以下命令查看: from tensorflow.python.client import device_lib
print(device_lib.list_local_devices())
可以看到GPU信息。
cuda卸载:
cd /usr/local/cuda-9.2/bin/
sudo ./uninstall_cuda_9.2.pl
cuda卸载完成。
anaconda下创建虚拟环境并且安装tensorflow-gpu:
1.conda create -n mytf python=3.6
2.激活环境:conda activate mytf(退出环境:conda deactivate)
3.pip install tensorflow-gpu==2.0 #根据自己需要的版本安装
4.安装完,进入python,导包:import tensorflow 观察是否成功
tensorflow卸载:pip3 uninstall protobuf #或者加sudo ,也可以将pip3换成pip
sudo pip3 uninstall tensorflow-gpu #可以将pip3换成pip
删除虚拟环境:conda remove -n mytf --all
keras安装:sudo pip3 install keras # 或者将pip3换成pip
卸载:sudo pip3 uninstall keras # 或者将pip3换成pip
ubuntu 查看tensorflow,keras版本:1.进入python
2.import tensorflow
print(tensorflow.__version__)
同理keras:import keras
print(keras.__version__)
UBUNTU安装CUDA,参考链接:https://blog.csdn.net/u010801439/article/details/80483036
CUDA和cudnn对应版本参考链接: https://blog.csdn.net/tangjiahao10/article/details/125225786
页:
[1]