深度学习入门教程:国庆花半个小时在windows平台上搭建起深度学习环境!

文摘   2024-10-01 13:00   新加坡  

点击订阅公众号 | 前沿学术成果每日更新               

本文目录

  • 写在前面的话

  • 安装过程

    • 寻找系统以及显卡等支持信息

    • 选择以及下载合适cuda版本

    • CUDA安装检查

    • 安装以及验证cuDNN库

    • 下载pytorch以及测试深度学习环境是否正常

  • 总结

写在前面的话

最近更换了电脑,需要在新电脑上安装深度学习环境,于是将其完整地记录下来,分享给各位朋友,希望能帮助给大家。

虽然 2022 年,在CSDN平台上分享过深度学习环境的安装教程:windows 安装 cuda 11.8 以及 tensorflow-gpu 2.6。但是,我重新安装深度学习环境时(此时是 2024 年 9 月),发现某些步骤有些变化,但总体上变得更加简单。所以我夸下海口,跟我一起,半个小时搞定深度学习环境的环境吧!

ps: 下面的安装步骤几乎完全展示了安装以及测试过程中出现的界面,以及测试过程。我认为已经非常细致了,欢迎点赞和收藏!如果安装过程中,遇见其他问题,也欢迎留言评论。

本文的安装目标:

  • CUDA:CUDA(Compute Unified Device Architecture)是 NVIDIA 推出的一个并行计算平台和 API,它让开发者能够使用 NVIDIA 的 GPU 来进行通用计算——即在 GPU 上进行非图形计算。这对于执行大规模计算工作非常有用,尤其是在科学研究、工程领域以及需要大量数学计算的数据分析和深度学习应用中。
  • cuDNN:cuDNN(CUDA Deep Neural Network library)是 NVIDIA 针对深度神经网络操作开发的一个 GPU 加速库。它提供了高度优化的例程,这些例程能够加速深度学习框架(如 TensorFlow、PyTorch 和 Caffe 等)中的多种标准操作,比如卷积、池化等。这个库是为了提高运行时效率和降低编程难度而设计的。
  • pytorch:PyTorch 是一个开源的机器学习库,广泛用于应用程序如计算机视觉和自然语言处理等领域的研究和生产。它由 Facebook 的人工智能研究团队开发。其他的深度学习框架有 TensorFlow、Caffe 以及国产飞桨。

安装过程

寻找系统以及显卡等支持信息

首先交代我的系统平台信息:

  • 操作系统:Windows 11 专业工作站版,版本号 23H2
  • 显卡:4060 Laptop GPU
  • 驱动版本:546.60

操作系统不是决定安装是否成功的制约因素,但是显卡以及驱动版本有可能影响是否成功。

首先调出NVIDIA控制面板查看自己的 NVIDIA 显卡的驱动版本,如下:

image-20240929232914000

并且在CMD中输入NVIDIA-SMI查看自己支持的Cuda版本:

image-20240929233340369

nvidia-smi 命令显示的 CUDA 版本通常是指 GPU 驱动兼容的最新 CUDA 版本。实际上,你可以安装和使用较早版本的 CUDA。具体要安装什么版本,就需要看我们的 pytorch 版本的需要。

选择以及下载合适 cuda 版本

首先,访问 pytorch 官方网站:https://pytorch.org/

image-20240929234147915
image-20240929234604906

可以看到最新版本是pytorch==2.4.1,对应的cuda版本是11.812.1以及12.4。而我的显卡驱动最高支持CUDA==12.3,所以要安装``pytorch==2.4.1,要么升级显卡驱动,要么选择低版本的cuda11.8以及12.1均可。选定对应的cuda版本之后(我选择的版本是11.8),会出现对应的pip`命令,如我的是:

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

提示:如果要复现的代码使用的旧版本的pytorch,那么可以查看旧版本的cuda支持:

image-20240929234220785

比如下图,可以看到,2.4.0版本的 pytorch 支持的cuda版本以及下载命令:

image-20240929235102337

注意,只有 cuda 下面的下载命令,下载下来的库才是支持 GPU 的。


现在,有了目标:cuda==11.8之后,我们访问 NVIDIA 的 CUDA 下载网页:https://developer.nvidia.cn/downloads,并下载CUDA工具包

image-20240929233501229
image-20240929233621475

要注意的是:显示都是最新版本的 CUDA,但是新版 CUDA 不一定意味着适合 pytorch!所以要按照下图的提示,下载对应的旧版本 CUDA。

image-20240929235958703
image-20240930000027454

下面选的时候,要注意自己的系统版本:

image-20240930000318007

下载完成后,得到:

image-20240930000354977

双击,进行安装时,会提示暂时的解压路径,因为我不喜欢保留这些临时文件,我选择解压到下载路径:

image-20240930000512844
image-20240930000711497

注意,这个临时路径,其实不需要特定的选择,因为安装完成后,会自动清理。但是这里为了演示需要,仍然修改了路径。

image-20240930000726920

下面开始安装,按照下面提示,一步步进行:

image-20240930000951313
image-20240930001106271
image-20240930001124185
image-20240930001141837
image-20240930001218966
image-20240930001301370

到现在,CUDA 安装工作完成。下面开始测试 CUDA 安装是否正常

CUDA 安装检查

CUDA 安装好之后,会新建两个环境变量CUDA_PATH以及CUDA_PATH_V11_8

image-20240930001421266
image-20240930001441059
image-20240930001500262
image-20240930001532888

到这一步要重启电脑

然后在cmd输入nvcc -V验证是否安装成功:

image-20240930002703613

然后查看 cuda 的配置路径是否正确识别,输入set cuda

image-20240930002809667

安装以及验证 cuDNN 库

目前 cuda 部分安装完成,现在开始安装cuDNN库。

开始访问:https://developer.nvidia.com/cudnn-downloads,并下载cuDNN,注意下载最新cuDNN即可。

image-20240930003036185
image-20240930003146199
image-20240930003238093

下面开始安装:

image-20240930003254528
image-20240930003338347
image-20240930003355063

安装完成 cuDNN,顺利的情况下,系统的PATH环境变量会新增两个路径:

image-20240930003553746

现在验证 cudnn 是否是正常的,需要使用 cuda 的deviceQuery.exebandwidthTest.exe进行验证:

首先,在 CMD 中输入:

cd "C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8\extras\demo_suite"

然后输入.\bandwidthTest.exe

image-20240930004555524
image-20240930004318474

看到 PASS,即为通过测试。

再输入.\deviceQuery.exe:

image-20240930004723720

看到 PASS,即为通过测试。

下载 pytorch 以及测试深度学习环境是否正常

使用前期得到的命令安装pytorch

image-20240930005100298
image-20240930005434028

这里有提示,要添加额外的环境变量信息,虽然我认为不添加也没影响,但是还是按照提示进行了添加:

image-20240930005341404
image-20240930005739234

然后依次输入:

import torch
torch.cuda.is_available()

如下图显示,就意味着全部安装成功

image-20240930005841866

当然也可以复制下面的代码块,来查看是不是能够输出识别到的显卡信息:

device_count = torch.cuda.device_count()
if device_count > 0:
    for i in range(device_count):
        print(f"GPU {i}: {torch.cuda.get_device_name(i)}")
else:
    print("No GPUs available.")
image-20240930005958294

总结

安装是不是很简单?所以没有额外总结。期待在下一篇文章中再次相遇。

               

               

声明:本公众号分享的前沿学术成果来源于各学术网站,不依法享有其所有权。若原作者发现本次分享中的文字及图片涉及侵权,请立刻联系公众号后台或发送邮件,我们将及时修改或删除!         

邮箱:environmodel@sina.com         

若您认为有用,欢迎

Environmodel设为星标,或

点击“在看”或“分享”给他人

Environmodel
Environmodel(环境模型)专注于环境科学与工程领域的建模及模型研究进展,并分享涵盖机器学习、深度学习以及人工智能等相关领域的理论知识、主流工具和Python编程技巧。
 最新文章