第2期 基于YOLOv8的玩手机行为检测系统(环境配置+数据集+Python源码+PyQt5界面)

文摘   2025-01-03 00:30   北京  
        玩手机行为检测的重要性日益凸显,它不仅是维护课堂、会议室等公共场所秩序、提升工作效率的关键一环,更是预防因过度使用手机导致的分心事故、保护个人与集体安全的重要屏障。借助先进的智能化技术,采用基于深度学习模型的玩手机检测系统,能够高效而准确地识别监控画面中的玩手机行为,实现对不当使用手机情况的即时监测与提醒,为相关管理人员提供直观、可靠的数据反馈。这有助于管理者迅速识别问题、采取措施,有效引导和规范手机使用行为,营造一个更加专注、高效且安全的工作与学习环境,促进形成良好的行为习惯,提升整体的社会运行效率与质量。   
基于YOLOv8的玩手机行为检测系统
一、环境部署
1.1 Anaconda安装
        Anaconda是一个专为Python设计的免费增值开源发行版,专注于大规模数据处理、预测分析和科学计算,它通过集成Conda包和环境管理器,简化了包的管理与部署,并支持Linux、Mac和Windows系统。Anaconda提供高性能、跨平台支持及1000多个开源库,安装简便且默认包含pip和conda,实现包版本隔离和虚拟环境管理,极大促进了科学计算和数据分析的便捷性
Step 1: 下载Anaconda 安装包
# Anaconda官网 https://www.anaconda.com/
Step 2: 安装Anaconda
双击exe文件开始安装
点击Next
同意协议,点击I Agree
两个选项均可,第一个是只为当前用户安装,第二个是为所有用户安装。
修改安装路径,建议不要装到C盘
建议把环境变量勾上,后续就不用单独配置环境变量,更便捷一些
等待安装,后面几步直接都点击next,就能直接完成安装了,最后点击finish.
Step 3: 检查Anaconda和Python是否安装成功
WIN+R键调出运行窗口,输入cmd回车
输入conda -V命令,可以看到版本信息,代表安装成功。
输入python命令,查看python是否安装成功。
1.2 Cuda安装
     CUDA(Compute Unified Device Architecture)是英伟达(NVIDIA)公司推出的一种并行计算平台和编程模型。它充分利用图形处理单元(GPU)的强大并行处理能力,使GPU能够解决复杂的计算问题。CUDA平台包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎,开发人员可以使用C、C++、Fortran、Python等多种编程语言来为CUDA架构编写程序,这些程序能在支持CUDA的处理器上以超高性能运行。CUDA还提供了丰富的开发库、运行期环境和驱动支持,以及跨平台兼容性,可以广泛应用于图形渲染、人工智能、科学计算、视频处理、金融模拟等多个领域。通过CUDA,开发者能够高效地利用GPU的并行计算能力,加速计算密集型应用的执行速度,提升整体计算性能。
查看操作系统是否支持GPU。打开任务管理器,点击性能
表明电脑支持GPU计算。如果电脑不支持GPU,后续操作也就不需要了,只能使用CPU进行深度学习。
执行如下命令,检查操作系统是否已经安装了CUDAnvcc -V
说明并未安装CUDA。执行如下命令,查看Windows操作系统NVIDIA GPU驱动版本以及支持的CUDA最高版本。
NVIDIA显卡驱动版本为546.83,支持的CUDA最高版本为12.3然后打开下列网址,可以查看CUDA版本和对应的NVIDIA GPU驱动版本兼容表格。https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html可以看到CUDA版本不高于CUDA 12.3 Update 1版本均可
打开下列网址,可以下载CUDAhttps://developer.nvidia.com/cuda-toolkit-archive
选择对应的版本,点击下载
选择对应的操作系统Windows,并选择对应操作系统配置, 点击Download下载
双击下载的CUDA安装可执行程序,需要选择一个临时目录存放抽取的安装包(安装完成后会自动删除临时目录、安装的目标目录在后面选择)
点击关闭,安装完成。执行如下命令,检查是否安装成功nvcc -V下图表示已经安装成功。 

1.3 CuDNN安装

        cuDNN(NVIDIA CUDA Deep Neural Network library)是英伟达(NVIDIA)开发的一套专为深度神经网络设计的高性能GPU加速库。它基于CUDA平台,为深度学习框架(如TensorFlow、PyTorch等)提供了高度优化和易于使用的原语,这些原语涵盖了卷积、池化、激活函数、前向传播、反向传播等神经网络中的核心操作。cuDNN通过充分利用GPU的并行计算能力,显著提升了深度学习模型的训练和推理速度。其高度优化的算法和内核设计,使得cuDNN成为构建高性能深度学习应用的不可或缺的工具之一。无论是学术研究还是工业应用,cuDNN都以其出色的性能和易用性赢得了广泛的认可和使用。
  登录下列地址,可以下载cuDNN  https://developer.nvidia.com/cudnn-downloads
下载完成后,解压后目录结构
将目录bin、lib、include复制到CUDA的安装目录下
最后将如下path添加到环境变量Path中
1.4 PyTorch安装
        PyTorch是一个开源的机器学习库,由Facebook的人工智能研究院(FAIR)开发并维护。它提供了强大的GPU加速张量计算功能以及动态计算图,使得构建和训练神经网络变得既灵活又高效。PyTorch的设计哲学强调直观性和易用性,其面向对象的API使得模型定义、损失函数计算和优化步骤更加直观易懂。此外,PyTorch还支持丰富的深度学习算法和模型,以及广泛的社区支持和丰富的教程资源,为研究人员和开发者提供了一个强大的工具集,帮助他们更快地实现和验证新的想法。无论是在学术研究、工业应用还是教育领域,PyTorch都以其灵活性和易用性赢得了广泛的赞誉和使用。
打开Pytorcch官网https://pytorch.org/
1.创建虚拟环境torch-gpuconda create -n torch-gpu python==3.92.激活环境torch-gpuconda actiavte torch-gpu3.安装pytorchpip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
检验Pytorch是否安装成功import torch# 查看torch版本print(torch.__version__)# 查看cudaprint(torch.cuda.is_available())
二、数据集
在线标注
打开下列网址https://www.makesense.ai/
点击get Started
导入照片,点击Object Detection,然后创建标签playPhone
画锚框,选择标签
标注完成,导出标签,共两种形式VOC和YOLO格式
最后点击Export即可
labelme标注
创建虚拟环境labelmeconda create -n labelme python==3.9激活环境labelmeconda activate labelme安装lebelmepip install pyqtpip install pillowpip install labelme打开labelmelabelme
打开文件夹,创建锚框,并添加标签,标签保存为txt文件
将数据保存为以下目录---playPhoneDataset---------images---------------train---------------val---------labels---------------train---------------val

猫脸码客
猫脸码客:致力于技术深度分享,开源数据集共享,为您提供个性化的专业服务。
 最新文章