干货 | OpenCV库处理视频文件，并对照片进行三维建模

2024-10-17 08:30 重庆

点击下方卡片，关注“机器视觉与AI深度学习”

视觉/图像重磅干货，第一时间送达!

本文转载自微信公众号：数字地形分析，版权归原作者及刊载媒体所有，如有侵权请立即与我们联系，我们将及时处理。‍

前言

本次实验是实现的是根据无pos文件的视频文件建立3d纹理模型，在传统的摄影测量软件中（如Pix 4D），对于一般的视频文件无法进行3dmaps处理，存在两方面的问题：

（1）相机文件缺失，无法进行缺失内外定向元素；

（2）地理定位文件缺失，无法进行处理；

图1：pix4D处理普通视频文件截图

一、Opencv库

OpenCV是一个功能强大的开源计算机视觉库，它支持多种编程语言和操作系统，提供了超过2500个优化算法，用于图像处理、视频分析、物体检测和机器学习等领域。由于其高性能和实时处理能力，OpenCV被广泛应用于面部识别、自动驾驶、机器人视觉、视频监控、医疗图像分析和增强现实等场景。开发者可以通过访问OpenCV的官方网站下载库文件，并利用其丰富的文档和社区资源进行学习和开发。Python用户可以通过pip轻松安装OpenCV的Python接口。

表1：cv库安装

二、读取视频文件

下述代码定义了一个名为 extract_frames 的函数，它的作用是从指定的视频文件中提取帧，并将这些帧作为图片保存到指定的输出文件夹中。函数接受三个参数：video_path 是视频文件的路径，output_folder 是保存提取帧的图片的文件夹路径，max_frames 是要提取的最大帧数，默认值为100。

以下是代码的详细解释：

1. 使用 cv2.VideoCapture 打开视频文件，参数是视频文件的路径。

2. 检查视频文件是否成功打开，如果没有成功打开，则打印错误信息并返回。

3. 如果输出文件夹不存在，则使用 os.makedirs 创建该文件夹。

4. 初始化 frame_count 计数器，用于跟踪提取的帧数。

5. 使用 while True 循环逐帧读取视频，直到读取到视频的末尾或达到最大帧数限制。

6. 使用 video_capture.read() 读取每一帧，如果读取失败，则打印错误信息并退出循环。

7. 使用 cv2.flip 函数将帧垂直翻转（参数180表示垂直翻转）。

8. 构建每一帧的输出文件路径，使用 os.path.join 将输出文件夹和帧编号组合成完整的文件路径。

9. 使用 cv2.imwrite 将帧保存为PNG格式的图片到输出文件夹中。

10. 打印保存的帧信息。

11. 增加 frame_count 计数器，如果达到最大帧数限制，则退出循环。

12. 使用 video_capture.release() 释放视频捕捉对象。

13. 打印完成提取帧的信息。

14. 如果在执行过程中发生异常，打印异常信息。

使用示例部分展示了如何调用 extract_frames 函数，指定了视频文件路径 video_path、输出文件夹路径 output_folder 和最大帧数 max_frames（在这个例子中限制为50帧）。

import cv2import osdef extract_frames(video_path, output_folder, max_frames=100):    try:    # 打开视频文件        video_capture = cv2.VideoCapture(video_path)        # 检查视频是否成功打开        if not video_capture.isOpened():            print(f"Error opening video file: {video_path}")            return        # 确保输出文件夹存在，如果不存在则创建        if not os.path.exists(output_folder):            os.makedirs(output_folder)        frame_count = 0        while True:            print(f"Reading frame: {frame_count}")  # 打印当前帧编号            # 逐帧读取视频            ret, frame = video_capture.read()            # 如果读取失败，退出循环            if not ret:                print(f"Failed to read frame at frame_count: {frame_count}")                break            # 翻转图像（垂直翻转）            frame = cv2.flip(frame, 180)            # 构建帧的输出文件路径            frame_filename = os.path.join(output_folder, f"frame_{frame_count:04d}.png")            # 保存帧为图片            cv2.imwrite(frame_filename, frame)            # 打印保存信息            print(f"Saved: {frame_filename}")            frame_count += 1            if frame_count >= max_frames:                break                 # 释放视频捕捉对象        video_capture.release()        print("Finished extracting frames.")    except Exception as e:        print(f"An error occurred: {e}")# 使用示例video_path = "C:/Use/Desktop/shi/veconomy.mp4"  # 输入视频文件路径output_folder = "C:/Use /Desktop/folder"# 输出图片保存文件夹extract_frames(video_path, output_folder, max_frames=50)  # 限制读取的帧数

提取结果展示：

图2：提取结果

三、构建模型

本次处理数据的环境为3DF Zephyr Aerial 。3DF Zephyr Aerial是一款由 3Dflow 开发的专业三维建模软件，专门用于从航拍照片生成三维模型。这款软件提供了一系列的工具，专门为日常地理测量和分析、无人机/UAV 制图、建筑等领域设计。可以有效的处理无定位信息的图像。具体步骤如下所示：

（1）新建项目；在3DF Zephyr Aerial运行环境中（下同），选择菜单栏中的【工作流程】→选择【新建项目】。

图3：新建项目

（2）加载数据，设置工作格式。在【处理选项】界面，勾选【创建项目后处理三维模型】和【在线检测预处理的照片校准】。

图4：加载数据

（3）添加照片数据；在【选择照片页面】中，加载上述文件夹中每一帧的图像。

图5：添加照片

（4）相片校准；在【相机校准】页面，选择自动校正照片。

图6：相机校准

（5）设置点云重建格式；选择默认格式。

图7：相机定向和点云设置

（6）运行过程；这里可以把多余的点和面全部删掉；

图8：运行过程

（7）结果图；

（a）稀疏点云

图9：结果图

小结

通过上述过程处理，可以通过普通的视频文件生成点云数据，但对于动态物体控制点的捕捉仍然存在困难，三维纹理数据仍需要在blender软件中优化渲染。

图10：静态建筑三维纹理效果

—THE END—

觉得有用，麻烦给个赞和在看

http://mp.weixin.qq.com/s?__biz=MzU4ODM4NjcyMg==&mid=2247494676&idx=2&sn=22e0788c0faf939548fe0d8365edadfb

机器视觉与AI深度学习

专注于机器视觉、AI、深度学习等技术最新资讯、实战内容及应用案例的分享，交流！

最新文章

YOLOv11在自定义数据集上训练做实例分割

Halcon和Opencv 的区别

基于YoloV8的药丸/片剂类型识别

使用OpenCV进行球跟踪和落点预测

深度学习“三板斧” ，螺丝检测“快准狠”

基于深度学习模型融合的工业产品（零部件）工艺缺陷检测算法简述

基于深度学习的轮胎缺陷检测系统

双目相机深度检测

实战 | 基于YOLOv8的车辆跟踪与车速计算应用（步骤 + 源码）

机器视觉在苹果中的应用

大型视觉语言模型OMG-LLaVA：图像级、目标级和像素级的推理和理解任务统一

如何解决工业缺陷检测小样本问题？

机器视觉应用案列-半导体芯片检测

超越YOLOv10/11、RT-DETRv2/3！中科大D-FINE重新定义边界框回归任务

一文带你了解X-Ray点料机原理与应用

在win11上跑yolo目标检测算法全流程

实战 | OpenCV中更稳更快的找圆方法--EdgeDrawing使用演示（详细步骤 + 代码）

Ubuntu24.04 安装 OpenCV4.10.0 和CUDA12.6

基于机器视觉的外观瑕疵缺陷检测系统

干货 | 鱼眼镜头模型和校正方法详解

实战 | 使用姿态估计算法构建简单的健身训练辅助应用程序

干货 | 双目相机标定与图像深度估计

基于YoloV11自定义数据集实现车辆事故检测

基于Segformer实现PCB缺陷检测(步骤 + 代码)

完爆YOLO家族？新一代目标检测器又有新突破！

计算机视觉开发者都应掌握的10个必备工具

YOLOv11 C++ TensorRT项目使用

使用OpenCV实现摄像头测距

PaddleOCR 2.9 发布，正式开源文本图像智能分析利器

Python和C++中使用并行计算增强图像处理能力

使用树莓派4 + Coral USB加速器实现姿态检测

基于zbar的二维码识别

实战 | YOLO11自定义数据集训练实现缺陷检测 (标注+训练+预测保姆级教程)

YOLOv8预测参数详解（全面详细、重点突出、大白话阐述小白也能看懂）

TPAMI | SegNet:语义分割领域超经典轻量化模型

海康威视前端摄像头镜头基础知识，值得收藏学习！

实战 | 使用YOLOv8图像分割实现路面坑洞检测（步骤 + 代码）

干货 | OpenCV库处理视频文件，并对照片进行三维建模

T-Rex Label ！超震撼 AI 自动标注工具，开箱即用、检测一切

基于机器视觉的泡罩药板缺陷检测方案

基于YOLOv8的关键点检测的仪表盘读数方案详解

一文看懂工业视觉与计算机视觉的区别

YOLO11介绍及五大任务推理演示(目标检测，图像分割，图像分类，姿态检测，带方向目标检测)

基于拉普拉斯金字塔实现图像融合（步骤 + 代码）

使用PyTorch进行小样本学习的图像分类

可解释性AI：GradCAM介绍

基于3D机器视觉的大圆柱电池测量方案

基于OpenCV实现模糊检测 / 自动对焦

工业相机标定相关知识整理（内参、外参、畸变参数......）

如何看待今年比亚迪秋招只要双2以上的？

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉