Ubuntu使用Tesla P4配置Anaconda+CUDA+PyTorch

文化 2024-10-27 18:50 北京

我们之前测试了在Windows系统如何安装Tesla M4（成了！Tesla M4+Windows 10+Anaconda+CUDA 11.8+cuDNN+Python 3.11），前面安装好了Ubuntu 22.04.4的操作系统（Ubuntu 22.04.4安装Docker引擎）。今天，简单测试一下在Ubuntu系统上如何把新买的Tesla P4用起来。

首先，我们到NVIDIA官网找到Ubuntu 22.04对应的驱动，下载下来。

这里可以看到，基本上数据中心GPU的驱动都是通用的，从最低端的Tesla M4，到最高端的H系列和L系列，一个驱动文件通杀了。

驱动文件的现在链接如下：

https://cn.download.nvidia.cn/tesla/550.54.15/nvidia-driver-local-repo-ubuntu2204-550.54.15_1.0-1_amd64.deb

下载完成后，对于deb文件，一般有两种安装方式：命令行或者GUI图形界面。GUI图形界面非常简单，只需要在文件管理器中找到下载好的.deb文件并双击运行即可，之后系统会自动调用软件安装程序。根据图形界面中显示的软件相关信息，点击“安装”按钮开始安装过程，直至安装完成。

但对于我来讲，配置了GPU之后，控制台会因为缺少驱动卡在POST页面，所以还是需要先通过命令行方式来安装驱动。

命令行方式主要使用dpkg命令进行安装，命令如下：

dpkg -i nvidia-driver-local-repo-ubuntu2204-560.35.03_1.0-1_amd64.deb

初次尝试安装时，系统可能会提示公钥（GPG key）未安装。为了能够信任NVIDIA提供的软件包仓库，我们需要执行以下命令，将NVIDIA的公钥复制到系统的keyrings目录下：

cp /var/nvidia-driver-local-repo-ubuntu2204-560.35.03/nvidia-driver-local-73056A76-keyring.gpg /usr/share/keyrings/

然后再次执行安装命令，此时，最新版本已经加载到本地仓库。

完成之后，运行以下命令更新软件包列表。

apt update

接下来，使用以下命令来安装最新版本的NVIDIA驱动，指定版本号为550。

apt install -y nvidia-driver-560

安装完毕后，执行reboot命令重启系统，让新安装的NVIDIA驱动生效。重启后，运行nvidia-smi命令，查看NVIDIA驱动是否加载成功。

nvidia-smi

如果在桌面进行查看，通过Nvidia X Server Setting可以看到设备信息的图形展示。

设备信息。

安装好了驱动程序，接下来，我们来安装CUDA。

首先，安装实际情况选择CUDA的环境配置，如下图所示：

不太建议选择使用runfile文件，编译可能会遇到问题，报错太多，不好解决。按照提示，下载并安装deb程序，整体和安装驱动的过程类似。

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-ubuntu2204.pinmv cuda-ubuntu2204.pin /etc/apt/preferences.d/cuda-repository-pin-600wget https://developer.download.nvidia.com/compute/cuda/12.6.2/local_installers/cuda-repo-ubuntu2204-12-6-local_12.6.2-560.35.03-1_amd64.debdpkg -i cuda-repo-ubuntu2204-12-6-local_12.6.2-560.35.03-1_amd64.deb

安装CUDA套件。

cp /var/cuda-repo-ubuntu2204-12-6-local/cuda-*-keyring.gpg /usr/share/keyrings/apt-get updateapt-get -y install cuda-toolkit-12-6

CUDA提供了两种安装模式，传统内核的cuda-drivers和开发内核的nvidia-open。nvidia-open是NVIDIA提供的一种开源内核模块选项，适用于对图形性能要求不是极高，更注重软件开放性和兼容性的场景；cuda-drivers是NVIDIA的传统（闭源）驱动选项，用于支持CUDA技术，适用于需要进行高性能计算或专业图形处理的场景，这些场景对GPU的计算能力和高级图形功能有较高的要求。

所以，我们本次选择安装传统内核模块cuda-drivers，执行以下命令：

apt-get install -y cuda-drivers

安装完成后，查看CUDA版本信息。

接下来，安装Anaconda。先下载安装脚本：

wget https://repo.anaconda.com/archive/Anaconda3-2024.10-1-Linux-x86_64.sh

然后赋予可执行权限并执行：

chmod +x Anaconda3-2024.10-1-Linux-x86_64.shsh Anaconda3-2024.10-1-Linux-x86_64.sh

按照提示完成安装。

默认情况下，Anaconda的Shell文件没有加载。

如果在上一步没有启用，在安装完成后，需要执行以下命令设置环境变量设置、激活Conda的Hook机制，并将conda集成到Shell的启动过程，之后就可以执行conda命令了。

/root/anaconda3/etc/profile.d/conda.sh

安装完成后，创建一个pytorch环境，并激活。

conda create --name pytorch python = 3.10    conda activate pytorch

然后就可以参照官网选项，获取安装命令了。

执行以下命令完成PyTorch环境部署

conda install pytorch torchvision torchaudio pytorch-cuda=12.4 -c pytorch -c nvidia

安装完成后，我们执行以下命令检验GPU设备是否可用。

import torch  if torch.cuda.is_available():    print("GPU可用")    device_name = torch.cuda.get_device_name(0)    print("设备名称:", device_name)    # 获取GPU属性（显存大小）    device_properties = torch.cuda.get_device_properties(0)        print("总显存大小:", device_properties.total_memory)

GPU设备检验成功，我们再运行一下矩阵运算，对比一下运算速度。

import torchimport timesize = (20000,20000)input_cpu = torch.randn(size)input_gpu = input_cpu.to(torch.device('cuda'))# 在CPU上执行矩阵乘法（耗时操作）start_time_cpu = time.time()output_cpu = torch.mm(input_cpu, input_cpu.t())duration_cpu = time.time() - start_time_cpu# 在GPU上执行同样的操作start_time_gpu = time.time()output_gpu = torch.mm(input_gpu, input_gpu.t().to(torch.device('cuda')))    duration_gpu = time.time() - start_time_gpuprint(f"CPU矩阵乘法运行时间: {duration_cpu:.6f} 秒")print(f"GPU矩阵乘法运行时间: {duration_gpu:.6f} 秒")

CPU的运算时间是10.2秒，GPU的运算时间为0.035474，差了大约286倍。

http://mp.weixin.qq.com/s?__biz=MzI4NjAzMTk3MA==&mid=2458857195&idx=1&sn=6249cdd3a7e6fd469a15cf57ea84c574

铁军哥

高级网络规划设计师，原中国电信高级技术规划工程师，天翼云认证高级解决方案架构师，H3C认证网络工程师。继续加油，努力传播知识，影响更多人！

最新文章

嘘！免费的Office LTSC专业增强版2024你要不要？

太诡异了？服务器居然可以自己控制自己关机，也没有蓝屏，没有关机计划任务，难道被人控制了？

在Windows Server测试一下不同CPU插槽数量对性能的影响

Win7任务管理器CPU性能引发的思考

网络服务状态检测三部曲

一个简单的设备升级操作

如何操作RAID 5阵列的扩容？

RAID 0阵列扩容后的磁盘扩展操作

如何操作RAID 0阵列的扩容？

RAID阵列的磁盘顺序能否调整？RAID重建需要多久？

使用storcli工具配置RAID，收藏这一篇就够了

[求助帖]电脑硬盘意外被BitLocker锁了，求解密方法

流量控制tc命令使用手册

保证转发PHB组

VXLAN小实验：VXLAN头端复制配置

EVPN小实验：配置实例间访问控制

如何将VMware ESXi中的虚拟机迁移到Workstation

exFAT文件系统通过挂载到Linux系统实现NFS网络共享

Windows Server2012 R2搭建NFS服务器

Windows不支持配置NFS？还有什么注意事项？

CDN内容分发网络加速效果测试

openssl-ecparam 命令手册

openssl-ec-chn命令手册

OpenSSL格式选项和密码选项简介

Ubuntu使用Tesla P4配置Anaconda+CUDA+PyTorch

神奇的H3C设备自动配置功能，不用按Ctrl-D/C了

Windows Server 绝技：PXE 服务 WDS 部署，让系统安装如虎添翼！

1024｜程序员充能大礼包及粉丝专属福利放送！

如何手工获取并更新ESXi中macOS的VMware Tools版本

借PVE8.0的Debian 12系统配置一下NFS服务器

如何使用OpenSSL创建RSA证书文件？

H3C iMC智能管理中心平台PLAT部署EIA/UAM/TAM组件

VMware使用vmkfstools命令将厚置备虚拟机磁盘转为精简置备

不使用USB，Windows电脑如何通过网络操控Android手机？

如何通过Windows电脑操控Android手机？

太卷了，能配置ADVPN的云主机一年只要37块钱！

H3Linux部署iMC智能管理中心平台PLAT-7.3_E0706实验

配置Windows系统对接天翼云VPN连接

使用Spring boot整合MyBatis，实现根据用户id查询用户信息功能

NAT域隧道模式IPsec安全模型

来吧，给大家分享一下最新版本的FortiGate-VM64，带试用授权

使用命令配置Windows和H3C VSR对接隧道模式的IPsec

Windows和H3C VSR对接隧道模式的IPsec隧道

使用6条命令完成Windows和H3C VSR的IPsec对接

MSR810配置有线Portal认证

还能这么玩？Windows通过netsh命令配置IPsec

Windows和H3C VSR对接IPsec VPN

手把手教你在天翼云部署一台FortiGate云主机

切换到WDDM模式，Tesla M4可以用于本地显示输出了！

使用IKE数字签名RSA认证建立IPsec隧道的配置案例

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉