实战 | 基于YOLOv8和OpenCV实现车速检测(详细步骤 + 代码)

文摘科技 2024-11-03 10:30 重庆

点击下方卡片，关注“OpenCV与AI深度学习”

视觉/图像重磅干货，第一时间送达!

导读

本文主要介绍如何使用YOLOv8+BYTETrack+OpenCV实现车辆速度的计算（详细步骤 + 代码)。

前言

您是否想过如何使用计算机视觉来估计车辆的速度？在本教程中，我们将探索从对象检测到跟踪再到速度估计的整个过程。

本文的实现主要包含以下三个主要步骤，分别是对象检测、对象跟踪和速度估计，下面我们将一一介绍其实现步骤。

车辆检测

要对视频执行对象检测，我们需要迭代视频的帧，然后对每个帧运行我们的检测模型。推理则提供对预先训练的对象检测模型的访问，我们使用yolov8x-640模型。相关代码和文档可参考链接：

https://github.com/roboflow/inference?ref=blog.roboflow.comhttps://inference.roboflow.com/?ref=blog.roboflow.com

import supervision as svfrom inference.models.utils import get_roboflow_model
model = get_roboflow_model(‘yolov8x-640’)frame_generator = sv.get_video_frames_generator(‘vehicles.mp4’)bounding_box_annotator = sv.BoundingBoxAnnotator()
for frame in frame_generator:    results = model.infer(frame)[0]    detections = sv.Detections.from_inference(results)
    annotated_frame = trace_annotator.annotate(        scene=frame.copy(), detections=detections)

当然您也可以将其替换为Ultralytics YOLOv8、YOLO-NAS或任何其他模型。您需要更改代码中的几行，然后就可以了。

import supervision as svfrom ultralytics import YOLO
model = YOLO("yolov8x.pt")frame_generator = sv.get_video_frames_generator(‘vehicles.mp4’)bounding_box_annotator = sv.BoundingBoxAnnotator()
for frame in frame_generator:    result = model(frame)[0]    detections = sv.Detections.from_ultralytics(result)
    annotated_frame = trace_annotator.annotate(        scene=frame.copy(), detections=detections)

车辆跟踪

物体检测不足以执行速度估计。为了计算每辆车行驶的距离，我们需要能够跟踪它们。为此，我们使用 BYTETrack，可在 Supervision pip 包中访问。

...
# initialize trackerbyte_track = sv.ByteTrack()
...
for frame in frame_generator:    results = model.infer(frame)[0]    detections = sv.Detections.from_inference(results)
    # plug the tracker into an existing detection pipeline    detections = byte_track.update_with_detections(detections=detections)        ...

如果您想了解有关将 BYTETrack 集成到对象检测项目中的更多信息，请访问 Supervision文档页面。在那里，您将找到一个端到端示例，展示如何使用不同的检测模型来做到这一点。

https://supervision.roboflow.com/how_to/track_objects/?ref=blog.roboflow.com

车速计算

让我们考虑一种简单的方法，根据边界框移动的像素数来估计距离。

当您使用点来记住每辆车每秒的位置时，会发生以下情况。即使汽车以恒定速度移动，其行驶的像素距离也会发生变化。距离相机越远，覆盖的距离越小。

因此，我们很难使用原始图像坐标来计算速度。我们需要一种方法将图像中的坐标转换为道路上的实际坐标，从而消除沿途与透视相关的失真。幸运的是，我们可以使用 OpenCV 和一些数学来做到这一点。

视角转换背后的数学

为了变换视角，我们需要一个变换矩阵，我们使用OpenCV 中的函数getPerspectiveTransform确定它。该函数有两个参数：源感兴趣区域和目标感兴趣区域。在下面的可视化中，这些区域分别标记为A-B-C-D和A'-B'-C'-D'。

在分析单个视频帧时，我们选择了一段道路作为感兴趣的源区域。在高速公路的路肩上，通常有垂直的柱子——标记，每隔固定的距离间隔开。在本例中为 50 米。感兴趣的区域横跨道路的整个宽度以及连接上述六个柱子的部分。

在我们的例子中，我们正在处理一条高速公路。Google 地图研究表明，感兴趣源区域周围的区域大约宽 25 米，长 250 米。我们使用此信息来定义相应四边形的顶点，将新坐标系锚定在左上角。

最后，我们将顶点A-B-C-D和的坐标分别重新组织A'-B'-C'-D'为二维SOURCE和TARGET矩阵，其中矩阵的每一行包含一个点的坐标。

SOURCE = np.array([    [1252, 787],     [2298, 803],     [5039, 2159],     [-550, 2159]])
TARGET = np.array([    [0, 0],    [24, 0],    [24, 249],    [0, 249],])

视角转换

需要一使用源矩阵和目标矩阵，我们创建一个 ViewTransformer 类。该类使用OpenCV的getPerspectiveTransform函数来计算变换矩阵。Transform_points 方法应用此矩阵将图像坐标转换为现实世界坐标。

class ViewTransformer:    def __init__(self, source: np.ndarray, target: np.ndarray) -> None:        source = source.astype(np.float32)        target = target.astype(np.float32)        self.m = cv2.getPerspectiveTransform(source, target)
    def transform_points(self, points: np.ndarray) -> np.ndarray:        if points.size == 0:            return points
        reshaped_points = points.reshape(-1, 1, 2).astype(np.float32)        transformed_points = cv2.perspectiveTransform(                reshaped_points, self.m)        return transformed_points.reshape(-1, 2)
view_transformer = ViewTransformer(source=SOURCE, target=TARGET)

用计算机视觉计算速度

现在我们已经有了检测器、跟踪器和透视转换逻辑。是时候计算速度了。原则上很简单：将行驶的距离除以行驶该距离所需的时间。然而，这项任务有其复杂性。

在一种情况下，我们可以计算每一帧的速度：计算两个视频帧之间行进的距离，并将其除以 FPS 的倒数，在我的例子中为 1/25。不幸的是，这种方法可能会导致非常不稳定和不切实际的速度值。

为了防止这种情况，我们对一秒钟内获得的值进行平均。这样，汽车行驶的距离明显大于闪烁引起的小盒子移动，我们的速度测量也更接近真实情况。

...
video_info = sv.VideoInfo.from_video_path('vehicles.mp4')
# initialize the dictionary that we will use to store the coordinates coordinates = defaultdict(lambda: deque(maxlen=video_info.fps))
for frame in frame_generator:    result = model(frame)[0]    detections = sv.Detections.from_ultralytics(result)    detections = byte_track.update_with_detections(detections=detections)
    points = detections.get_anchors_coordinates(        anchor=sv.Position.BOTTOM_CENTER)
    # plug the view transformer into an existing detection pipeline    points = view_transformer.transform_points(points=points).astype(int)
    # store the transformed coordinates    for tracker_id, [_, y] in zip(detections.tracker_id, points):        coordinates[tracker_id].append(y)
    for tracker_id in detections.tracker_id:
        # wait to have enough data        if len(coordinates[tracker_id]) > video_info.fps / 2:
            # calculate the speed            coordinate_start = coordinates[tracker_id][-1]            coordinate_end = coordinates[tracker_id][0]            distance = abs(coordinate_start - coordinate_end)            time = len(coordinates[tracker_id]) / video_info.fps            speed = distance / time * 3.6
...

速度估计隐藏的复杂性

在构建现实世界的车辆速度估计系统时，应考虑许多其他因素。让我们简要讨论其中的几个。

遮挡和修剪的盒子：盒子的稳定性是影响速度估计质量的关键因素。当一辆车暂时遮挡另一辆车时，方框大小的微小变化可能会导致估计速度值的巨大变化。

设置固定参考点：在本例中，我们使用边界框的底部中心作为参考点。这是可能的，因为视频中的天气条件很好——晴天，没有下雨。然而，很容易想象找到这一点会困难得多的情况。

道路的坡度：在本例中，假设道路完全平坦。事实上，这种情况很少发生。为了尽量减少坡度的影响，我们必须将自己限制在道路相对平坦的部分，或者将坡度纳入计算中。

—THE END—

下载1：Pytorch常用函数手册

在「OpenCV与AI深度学习」公众号后台回复：Pytorch函数手册，即可下载学习全网第一份Pytorch函数常用手册，包括Tensors介绍、基础函数介绍、数据处理函数、优化函数、CUDA编程、多处理等十四章内容。

下载2：145个OpenCV实例应用代码

在「OpenCV与AI深度学习」公众号后台回复：OpenCV145，即可下载学习145个OpenCV实例应用代码（Python和C++双语言实现）。

欢迎加入CV学习交流微信群！

觉得有用，记得点个赞和在看

http://mp.weixin.qq.com/s?__biz=MzU5NDM1MjU5Mg==&mid=2247510361&idx=1&sn=77855de709bc234f1d0dacf48238620b

OpenCV与AI深度学习

专注计算机视觉、深度学习和人工智能领域干货、应用、行业资讯的分享交流！

最新文章

实战 | OpenCV两种不同方法实现粘连大米分割计数(步骤 + 代码)

如何使用 YOLOv11 分割对象

基于YoloV8的药丸/片剂类型识别

使用OpenCV检测并计算直线角度

基于深度学习的轮胎缺陷检测系统

一文带你了解X-Ray点料机原理与应用

245个目标检测开源项目合集，建议收藏！

使用OpenCV实现球跟踪和落点预测

使用YoloV8检测PCB元件

OpenCV4.8 GPU版本CMake编译详细步骤与CUDA代码演示

轻松入门数字图像处理，搞定OpenCV编程！【文末送书】

YOLOv11在自定义数据集上训练做实例分割

仅用CPU就能跑到1000FPS，这是开源的C++跨平台人脸检测项目

单目实现车辆测距的方法

工业缺陷检测中数据标注需要注意的几个事项

实战 | 粘连物体分割与计数应用--密集粘连药片分割+计数案例

涨点神器！100个即插即用缝合模块【合集下载】

OpenCV实战 | 低对比度缺陷检测应用实例--LCD屏幕脏污检测

顶会新方向！全新多模态大模型统一分割框架

实战 | 基于YOLOv9和OpenCV实现车辆跟踪计数（步骤 + 源码）

实战 | 基于YOLOv8和OpenCV实现车速检测(详细步骤 + 代码)

OpenCV无缝融合应用--指定目标颜色改变(附C++源码)

今年顶会这情况。。。大家还是提前做准备吧！

超越YOLOv10/11、RT-DETRv2/3！中科大D-FINE重新定义边界框回归任务

完爆YOLO家族？新一代目标检测器又有新突破！

改动一行代码，PyTorch训练三倍提速，这些「高级技术」是关键

最强总结，99个时间序列+时空数据的顶会创新！

Ubuntu24.04 安装 OpenCV4.10.0 和CUDA12.6

基于YoloV11自定义数据集实现车辆事故检测

OpenCV实现保险丝颜色识别（附源码）

我发现了水CV顶会的最强套路，真的不需要脑子

OpenCV快速傅里叶变换(FFT)用于图像和视频流的模糊检测

实战 | 使用姿态估计算法构建简单的健身训练辅助应用程序

计算机视觉开发者都应掌握的10个必备工具

70G 项目文件 100 帧稳定运行？NVIDIA RTX™ 5000 Ada 性能跑分远超上一代！

实战 | OpenCV中更稳更快的找圆方法--EdgeDrawing使用演示（详细步骤 + 代码）

实战 | 用Python和MediaPipe搭建一个嗜睡检测系统 (详细步骤 + 源码)

245个目标检测开源项目合集，建议收藏！

YOLOv8预测参数详解（全面详细、重点突出、大白话阐述小白也能看懂）

又一本开源免费的大模型书来了，449页pdf！

60行代码训练/微调 Segment Anything 2 (SAM 2)

视觉算法岗，Kaggle金牌和CCF A一作哪个更有用？

YOLOv11 C++ TensorRT项目使用

实战 | YOLO11自定义数据集训练实现缺陷检测 (标注+训练+预测保姆级教程)

Python和C++中使用并行计算增强图像处理能力

PaddleOCR 2.9 发布，正式开源文本图像智能分析利器

实战｜OpenCV实时弯道检测(详细步骤+源码)

基于Segformer实现PCB缺陷检测(步骤 + 代码)

导师抢一作已成潜规则？牛马哭了。。。

重磅：PyCharm成为OpenCV官方IDE

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉