使用YOLO检测眼睛闭合 | 设定警报

科技 2024-10-27 10:06 中国香港

点击下方“深度学习爱好者”，选择加"星标"或“置顶”

我们将探讨如何使用OpenCV和YOLO目标检测模型来检测视频中的眼睛闭合，并在眼睛闭合超过特定阈值时发出警告。我们还将讨论将这种方法应用于实时检测的可能性。眼睛闭合检测在许多现实世界的应用中都是一个重要的用例，从监控驾驶员疲劳到确保关键环境中的警觉性。

先决条件

在开始之前，请确保已安装以下库：

OpenCV：用于视频处理和显示结果。
Ultralytics YOLO：一个流行且高效的深度学习模型，用于目标检测。

要安装必要的库，你可以运行：

pip install opencv-pythonpip install ultralytics

眼睛闭合检测算法概述

加载YOLO模型：我们加载一个预训练的YOLO模型（best.pt）用于眼睛检测。这个模型被训练来识别两种状态：“闭合”和“打开”的眼睛。下载模型
读取输入视频：使用OpenCV逐帧读取视频。
执行目标检测：使用YOLO检测每帧中眼睛的状态。
跟踪眼睛闭合持续时间：如果检测到眼睛“闭合”超过指定阈值，将显示警告。
显示结果：结果被写入输出视频文件，如果需要，警告消息会被叠加在帧上。

逐步实现

以下是使用YOLO和OpenCV检测视频中眼睛闭合的完整Python代码：

import cv2from ultralytics import YOLO

# Load the pre-trained YOLO modelmodel = YOLO("best.pt")names = model.names# Open the video filecap = cv2.VideoCapture("video.mp4")assert cap.isOpened(), "Error reading video file"w, h, fps = (int(cap.get(x)) for x in (cv2.CAP_PROP_FRAME_WIDTH, cv2.CAP_PROP_FRAME_HEIGHT, cv2.CAP_PROP_FPS))# Initialize video writer to save the outputvideo_writer = cv2.VideoWriter("output.avi", cv2.VideoWriter_fourcc(*"mp4v"), fps, (w, h))# Initialize variables for eye closure detectioneye_closed_frames = 0eye_closed_threshold_seconds = 1  # Threshold in secondseye_closed_threshold_frames = eye_closed_threshold_seconds * fps  # Convert seconds to frameswhile cap.isOpened():    success, im0 = cap.read()    if not success:        print("Video frame is empty or video processing has been successfully completed.")        break    # Predict the state of the eyes using YOLO    results = model.predict(im0, show=False)    boxes = results[0].boxes.xyxy.cpu().tolist()    clss = results[0].boxes.cls.cpu().tolist()    annotator = Annotator(im0, line_width=2, example=names)    eye_closed = False  # Flag to check if the eye is closed in the current frameIf boxes are not None:        for box, cls in zip(boxes, clss):            clsName = names[int(cls)]            xmax = int(box[0])            ymin = int(box[1])            xmin = int(box[2])            ymax = int(box[3])            # Set color based on the class name            if clsName == 'closed':                clr = (0, 0, 255)                eye_closed = True  # Mark eye as closed            elif clsName == 'opened':                clr = (0, 255, 0)            # Draw the bounding box and labelcv2.FONT_HERSHEY_SIMPLEX            Font_scale = 1            Font_thickness = 2            tw, th = cv2.getTextSize(clsName, font, font_scale, font_thickness)[0]            cv2.rectangle(im0, (xmin, ymin), (xmax, ymax), color=clr, thickness=2)            cv2.putText(im0, clsName, (xmax, ymin - 5), font, font_scale, color=clr, thickness=font_thickness)    # Check for eye closure duration    if eye_closed:        Eye_closed_frames += 1    else:# Reset counter if the eye is not closed    # Display warning if eye has been closed for more than the threshold    if eye_closed_frames > eye_closed_threshold_frames:        print("Warning: Eye has been closed for more than 2 seconds!")        cv2.putText(im0, "WARNING: Eye closed for more than 2 seconds!", (50, 50), font, font_scale, (0, 0, 255), font_thickness)    # Write the processed frame to the output video    video_writer.write(im0)# Release resourcescap.release()video_writer.release()

代码解释

模型加载：

使用ultralytics库中的YOLO类加载YOLO模型，并提取类名。

视频处理：

使用cv2.VideoCapture打开输入视频，并初始化视频写入器以保存输出。

逐帧检测：

逐帧处理视频。对于每一帧，使用YOLO模型检测眼睛并将其分类为“闭合”或“打开”。

眼睛闭合检测：

计数器（eye_closed_frames）跟踪眼睛被检测为“闭合”的连续帧数。如果这个计数超过阈值（在这种情况下，是1秒钟的帧数），则显示警告消息。

警告消息显示：

每当眼睛闭合超过阈值持续时间时，警告消息就会动态叠加在视频上。

实时检测的可能性

上述方法可以适应使用网络摄像头或实时视频流进行实时检测。以下是如何实现这一点的方法：

捕获实时视频：将视频文件输入更改为实时视频流，方法是将cv2.VideoCapture参数更改为0（默认网络摄像头）。

cap = cv2.VideoCapture(0)  # Use 0 for the default camera, or 1, 2, etc. for other cameras

优化实时性能：

为确保流畅的实时性能，你可能需要通过使用较小的模型（如YOLOv5s）或在可用的情况下在GPU上运行来优化模型推理速度。

实时显示结果：

使用cv2.imshow()实时显示视频流：

cv2.imshow("Eye Closure Detection", im0) if cv2.waitKey(1) & 0xFF == ord('q'):  # Press 'q' to quit     break

结合YOLO和OpenCV，你可以有效地检测视频或甚至实时中的眼睛闭合。这项技术在许多实际应用中都有应用，包括驾驶员监控系统、疲劳检测和在各种安全关键领域中的警觉性验证。通过利用像YOLO这样的深度学习模型，你可以在检测微妙的面部表情（如眼睛闭合）方面实现高准确性和性能。

下载1：Pytoch常用函数手册

在「深度学习爱好者」公众号后台回复：Pytorch常用函数手册，即可下载全网第一份Pytorch常用函数手册，涵盖Tensors介绍、基础函数介绍、数据处理函数、优化函数、CUDA编程、多线程处理等十四章章内容。

下载2：Python视觉实战项目52讲
在「小白学视觉」公众号后台回复：Python视觉实战项目，即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目，助力快速学校计算机视觉。

交流群

欢迎加入公众号读者群一起和同行交流，目前有SLAM、三维视觉驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群（以后会逐渐细分），请扫描下面微信号加群，备注：”昵称+学校/公司+研究方向“，例如：”张三 + 上海交大 + 视觉SLAM“。请按照格式备注，否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告，否则会请出群，谢谢理解~

http://mp.weixin.qq.com/s?__biz=MzU1OTYzNjg5OQ==&mid=2247569283&idx=2&sn=83d55f91b11dc0bd7f9fd449e1ba1fb2

深度学习爱好者

分享机器学习、深度学习和Python等知识与原理，每天分享深度学习与计算机视觉领域的经典和最新的论文总结，带读者一起跟踪前言科技！

最新文章

EMF-former：一种用于图像分割的高效且内存友好的Transformer

使用PyTorch从头开始构建CLIP | 对比语言图像预训练

详细记录u版YOLOv5目标检测NCNN实现

导师：自己每天科研工作近10小时，都觉得不够。研究生们，每天工作不够5小时，拿什么去竞争？

像堆乐高一样：从零开始解释神经网络的数学过程

特征选择：11 种特征选择策略总结！

YOLO 系列目标检测大合集

Swin-UMamba：基于ImageNet的预训练的基于Mamba的UNet网络

项目案例：基于 YOLO 的铝型材表面缺陷识别

Batch Normalization原理与实战

Jupyter Notebook 五大效率插件

卷积核的基本概况

【魔改UNet系列】Mamba-UNet: 医学图像分割的UNet类纯视觉Mamba

padding 在深度学习模型中重要吗？

超越YOLOv10/11、RT-DETRv2/3！中科大D-FINE重新定义边界框回归任务

如何评价Ultralytics出的YOLOv11？

有哪些东西是你读博士以后才懂的？

Jupyter Lab 十大高生产力插件

AODet: 基于 Transformers 的前景区域航空目标检测

黄仁勋预言成真了！！

【魔改UNet系列】LightM-UNet：Mamba与UNet结合实现轻量级图像分割

使用姿态估计轻松辅助健身房训练

传统图像处理还有前景么？

使用YOLO检测眼睛闭合 | 设定警报

一个神经元顶5到8层神经网络，深度学习的计算复杂度被生物碾压了

稚晖君玩了个大的：开源人形机器人全套图纸+代码

最全的损失函数汇总

pytorch优化器与学习率设置详解

PyCharm vs VSCode，是时候改变你的 IDE 了！

特征提取：传统算法 vs 深度学习

注意力机制是如何学习到模型所应注意的区域的？

深度学习常用损失函数总览：基本形式、原理、特点

一份微调YOLOv11的小指南

顶会 MICCAI'24 | LB-UNet：一种用于皮肤病变分割的轻量级边界辅助UNet

EI会议精选盘点：高校联办，IEEE Fellow助阵，可推优发表SCI

顶刊MIA'24 | 用于OCT图像分割的双坐标交叉注意力Transformer

如何写好一篇高质量的IEEE/ACM Transaction级别的计算机科学论文?

一个小改动，CNN输入固定尺寸图像改为任意尺寸图像

使用YOLOv8和ByteTracker进行实时人员跟踪和计数

用python写一个图像文字识别OCR工具

我导师啥时候得诺奖！Hinton致谢自己的研究生：“活都是他们干的”！

如何系统得对目标检测模型的误差分析？

【魔改YOLO系列】YOLO-SLD: 一种用于车牌检测的改进型YOLO注意力机制

一个博士生接受怎样的训练，才是完整而全面的科研训练？

一文让你通俗理解奇异值分解

YOLO-CCS：将坐标注意力机制引入YOLO用于车辆检测

针对不平衡问题建模的有趣Loss

使用YOLO World进行高性能目标检测

顶刊 TRGS'24 | 针对小型目标检测的增强层间特征相关性的轻量级融合策略

顶刊 MIA'24 | MA-SAM: 用于医学图像分割的模态无关SAM适应框架

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉