玩手机行为检测的重要性日益凸显,它不仅是维护课堂、会议室等公共场所秩序、提升工作效率的关键一环,更是预防因过度使用手机导致的分心事故、保护个人与集体安全的重要屏障。借助先进的智能化技术,采用基于深度学习模型的玩手机检测系统,能够高效而准确地识别监控画面中的玩手机行为,实现对不当使用手机情况的即时监测与提醒,为相关管理人员提供直观、可靠的数据反馈。这有助于管理者迅速识别问题、采取措施,有效引导和规范手机使用行为,营造一个更加专注、高效且安全的工作与学习环境,促进形成良好的行为习惯,提升整体的社会运行效率与质量。 Anaconda是一个专为Python设计的免费增值开源发行版,专注于大规模数据处理、预测分析和科学计算,它通过集成Conda包和环境管理器,简化了包的管理与部署,并支持Linux、Mac和Windows系统。Anaconda提供高性能、跨平台支持及1000多个开源库,安装简便且默认包含pip和conda,实现包版本隔离和虚拟环境管理,极大促进了科学计算和数据分析的便捷性。
https://www.anaconda.com/
两个选项均可,第一个是只为当前用户安装,第二个是为所有用户安装。
建议把环境变量勾上,后续就不用单独配置环境变量,更便捷一些
等待安装,后面几步直接都点击next,就能直接完成安装了,最后点击finish.
Step 3: 检查Anaconda和Python是否安装成功输入conda -V命令,可以看到版本信息,代表安装成功。
输入python命令,查看python是否安装成功。
CUDA(Compute Unified Device Architecture)是英伟达(NVIDIA)公司推出的一种并行计算平台和编程模型。它充分利用图形处理单元(GPU)的强大并行处理能力,使GPU能够解决复杂的计算问题。CUDA平台包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎,开发人员可以使用C、C++、Fortran、Python等多种编程语言来为CUDA架构编写程序,这些程序能在支持CUDA的处理器上以超高性能运行。CUDA还提供了丰富的开发库、运行期环境和驱动支持,以及跨平台兼容性,可以广泛应用于图形渲染、人工智能、科学计算、视频处理、金融模拟等多个领域。通过CUDA,开发者能够高效地利用GPU的并行计算能力,加速计算密集型应用的执行速度,提升整体计算性能。查看操作系统是否支持GPU。打开任务管理器,点击性能
表明电脑支持GPU计算。
如果电脑不支持GPU,后续操作也就不需要了,只能使用CPU进行深度学习。
执行如下命令,检查操作系统是否已经安装了CUDA
nvcc -V
说明并未安装CUDA。
执行如下命令,查看Windows操作系统NVIDIA GPU驱动版本以及支持的CUDA最高版本。
NVIDIA显卡驱动版本为546.83,支持的CUDA最高版本为12.3。
然后打开下列网址,可以查看CUDA版本和对应的NVIDIA GPU驱动版本兼容表格。
https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
可以看到CUDA版本不高于CUDA 12.3 Update 1版本均可
选择对应的操作系统Windows,并选择对应操作系统配置, 点击Download下载
双击下载的CUDA安装可执行程序,需要选择一个临时目录存放抽取的安装包(安装完成后会自动删除临时目录、安装的目标目录在后面选择)
点击关闭,安装完成。执行如下命令,检查是否安装成功
nvcc -V
下图表示已经安装成功。
1.3 CuDNN安装
cuDNN(NVIDIA CUDA Deep Neural Network library)是英伟达(NVIDIA)开发的一套专为深度神经网络设计的高性能GPU加速库。它基于CUDA平台,为深度学习框架(如TensorFlow、PyTorch等)提供了高度优化和易于使用的原语,这些原语涵盖了卷积、池化、激活函数、前向传播、反向传播等神经网络中的核心操作。cuDNN通过充分利用GPU的并行计算能力,显著提升了深度学习模型的训练和推理速度。其高度优化的算法和内核设计,使得cuDNN成为构建高性能深度学习应用的不可或缺的工具之一。无论是学术研究还是工业应用,cuDNN都以其出色的性能和易用性赢得了广泛的认可和使用。将目录bin、lib、include复制到CUDA的安装目录下
PyTorch是一个开源的机器学习库,由Facebook的人工智能研究院(FAIR)开发并维护。它提供了强大的GPU加速张量计算功能以及动态计算图,使得构建和训练神经网络变得既灵活又高效。PyTorch的设计哲学强调直观性和易用性,其面向对象的API使得模型定义、损失函数计算和优化步骤更加直观易懂。此外,PyTorch还支持丰富的深度学习算法和模型,以及广泛的社区支持和丰富的教程资源,为研究人员和开发者提供了一个强大的工具集,帮助他们更快地实现和验证新的想法。无论是在学术研究、工业应用还是教育领域,PyTorch都以其灵活性和易用性赢得了广泛的赞誉和使用。1.创建虚拟环境torch-gpu
conda create -n torch-gpu python==3.9
2.激活环境torch-gpu
conda actiavte torch-gpu
3.安装pytorch
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
检验Pytorch是否安装成功
import torch
# 查看torch版本
print(torch.__version__)
# 查看cuda
print(torch.cuda.is_available())
导入照片,点击Object Detection,然后创建标签playPhone
标注完成,导出标签,共两种形式VOC和YOLO格式
创建虚拟环境labelme
conda create -n labelme python==3.9
激活环境labelme
conda activate labelme
安装lebelme
pip install pyqt
pip install pillow
pip install labelme
打开labelme
labelme
打开文件夹,创建锚框,并添加标签,标签保存为txt文件
将数据保存为以下目录
---playPhoneDataset
---------images
---------------train
---------------val
---------labels
---------------train
---------------val