Skip to content

tensorflow/pytorch 安装准备

时效性: 2020年初

无论tf还是torch,它们都需要N卡驱动支持,我的笔记本是GTX 1650的显卡,现在tensorflow 2.1和pytorch 1.3, 默认推荐的是cuda 10.1的环境,该环境配置的nvidia驱动是418,据说到了nvidia430的驱动才支持1650的卡,所以可以先安装好驱动,再安装cuda,并且取消内置的驱动勾选。

注意:
在ubuntu下可以使用 sudo prime-select nvidia 来切换独显

  • cuda-toolkit 安装
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-repo-ubuntu1804_10.1.243-1_amd64.deb
sudo sh cuda_10.1.243_418.87.00_linux.run

完成安装后,需要配置环境变量,并执行ldconfig

 -   PATH includes /usr/local/cuda-10.1/bin
 -   LD_LIBRARY_PATH includes /usr/local/cuda-10.1/lib64, or, add /usr/local/cuda-10.1/lib64 to /etc/ld.so.conf and run ldconfig as root

注意:
目前(2020年初)cuda已经有10.2的版本了,但是tensorflow和pytorch的官方文档依旧是针对10.1的,理论上安装10.2的cuda也是可以的,但是有可能会报动态连接库异常等问题,需要mock一下,所以一般来说还是直接装10.1就好

  • cudnn的安装

和10.1对应的cuDNN版本有7.6.4(能不能装其它的其实我也没实验过)

这里给出几个相关的链接
cudnn

libcudnn

libcudnn-dev

libcudnn-doc

cudnn 是 tgz压缩包,需要解压,解压后执行

sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

注意:
如果出现so连接库问题,可以手工链接,或者再次copy cuda/lib64下对应的文件到/usr/local/cuda/lib64中

验证cudnn安装

cp -r /usr/src/cudnn_samples_v7 ./ 

build其中mnist的例子并执行,如果test通过,说明安装成功

  • tensorflow 安装
pip install tensorflow
  • pytorch 安装
pip install torch torchvision

Comments