【音视频】面试题集锦第 29 期｜视频渲染相关各种问题

文摘科技 2024-09-24 08:00 浙江

如果对音视频、AIGC、区块链技术感兴趣，可以关注一下保持联系：

我们在知识星球上创建的音视频技术社群关键帧的音视频开发圈已经运营了一段时间了，在这里大家可以一起交流和分享音视频技术知识和实战方案。我们会不定期整理一些音视频相关的面试题，汇集一份音视频面试题集锦（可进入免费订阅）。也会循序渐进地归纳总结音视频技术知识，绘制一幅音视频知识图谱（可进入免费订阅）。

下面是第 29 期面试题精选：

1、调试 OpenGL 特效的时候图像不对，有什么调试技巧能快速排查原因？
2、在实现类似 OBS 的实时的图片、GIF 贴片叠加和替换效果时遇到了性能瓶颈，请问如何实现快速的 GIF 贴片叠加和替换？
3、iOS 动态图片如何获取原始视频？
4、自己实现播放器时利用 FFmpeg 拿到解码后数据封装成 CVPixelbuffer 缓存用于渲染，但是缓存后数据只有几帧，但为什么内存占用有时候会有几百兆？

1、调试 OpenGL 特效的时候图像不对，有什么调试技巧能快速排查原因？

如果是大面积画面异常(比如黑屏或者绿屏)，先看是否在渲染时出现报错，可以使用 glGetError() 函数来调试。
如果没有报错或者少许图像错误，就在关键节点编写调试代码将纹理转换为 yuv 数据查看具体是哪一个节点出现问题。这些调试技巧可以方便快读定位问题：

iOS 可以转换成 CVPixelBuffer，调试模式下打开小眼睛即可看到图像。
Android 则需要把数据写入到文件，可用 FFmpeg 打开文件查看。
如果 iOS 想看二进制的数据也可以将二进制数据转换为 NSData，调试模式下打开小眼睛即可看到二进制内容(右下角也有 export 按钮)。

查看节点的顶点坐标、纹理坐标，vertex Shader 和 fragment Shader。然后修改调试 shader 内容和坐标数据看哪个环节出现问题。

2、在实现类似 OBS 的实时的图片、GIF 贴片叠加和替换效果时遇到了性能瓶颈，请问如何实现快速的 GIF 贴片叠加和替换？

下面是遇到性能问题所采用的方案：

使用 FFmpeg 的 overlay 滤镜和 SSE 像素计算方法在推流前实时叠加图片。
考虑到用户可能会传入多张图片，不能每一张都实时叠加，因此单开了一个进程利用 FFmpeg 命令先将这些贴片叠加并输出一张 PNG 图片。这样在实时叠加时，只需读取并叠加这张 PNG 图片，速度能够保证在 40ms 内，满足一秒 25 帧的帧率。

遇到的瓶颈：

用户可能会传入十几张静态图或 GIF，FFmpeg 处理成 1 分钟的 MP4 并解析为 PNG 图片大约需要十几分钟，如果直播间并发进行该操作，则会更慢。

解决方案：

想要快速的将这些滤镜和贴纸叠加到视频上需要结合 OpenGL 的能力。

FFmpeg 提供解码原视频和贴纸图片的能力，OpenGL 特效则将所有图片渲染在一起。

首先 OpengGL 将所有贴纸合为一张透明背景且大小与视频大小相同的纹理，然后 OpenGL 将解码后的视频数据转换成另一张纹理，最后视频纹理与贴纸纹理合二为一即可拿到叠加后的纹理。然后再将纹理转换为裸数据进行推流即可。

OpenGL 处理纹理和特效的效率很高，数据与纹理的转换耗时也不多，可以满足对性能的需求，只不过开发成本较高。

3、iOS 动态图片如何获取原始视频？

如果想要获取相册中实况照片对应的视频，可以使用 Photos 框架中的 PHAsset 类来实现。

以下是使用 Objective-C 获取实况照片视频的步骤：

首先，确保你的应用有权限访问用户的相册。您需要在 Info.plist 文件中添加 NSPhotoLibraryUsageDescription 键，并提供一个描述为什么应用需要访问相册的字符串。
使用相册选择页（例如 UIImagePickerController）来拿到你想要的实况照片，获取一个 PHAsset。使用 PHImageManager 的 requestLivePhotoForAsset:(PHAsset *)asset... 方法来获取每个实况照片的资源，获取一个 PHLivePhoto 实例。
调用 [PHAssetResource assetResourcesForLivePhoto:livePhoto] 方法即可获得两个 PHAssetResource。一个是对应的是图片，类型对应 PHAssetResourceTypePhoto，一个对应的是视频，类型对应 PHAssetResourceTypePairedVideo。

示例代码如下:

- (void)requestLivePhotoForAsset:(PHAsset *)asset {
    PHLivePhotoRequestOptions *options = [[PHLivePhotoRequestOptions alloc] init];
    options.deliveryMode = PHImageRequestOptionsDeliveryModeHighQualityFormat;
    options.networkAccessAllowed = YES;
    
    [[PHImageManager defaultManager] requestLivePhotoForAsset:asset
                                                       targetSize:PHImageManagerMaximumSize
                                                   contentMode:PHImageContentModeAspectFill
                                                      options:options
                                               resultHandler:^(PHLivePhoto * _Nullable livePhoto, NSDictionary * _Nullable info) {
        if (livePhoto) {
            [self processLivePhoto:livePhoto ];
        } else {
            NSLog(@"Failed to fetch live photo");
        }
    }];
}
- (void)processLivePhoto:(PHLivePhoto *)livePhoto  {
    NSArray<PHAssetResource *> * result = [PHAssetResource assetResourcesForLivePhoto:livePhoto];
    [result enumerateObjectsUsingBlock:^(PHAssetResource * _Nonnull obj, NSUInteger idx, BOOL * _Nonnull stop) {
        if (obj.type == PHAssetResourceTypePhoto){
            //
        } else if (obj.type == PHAssetResourceTypePairedVideo){
            //
        }
    }];
}

4、自己实现播放器时利用 FFmpeg 拿到解码后数据封装成 CVPixelbuffer 缓存用于渲染，但是缓存后数据只有几帧，但为什么内存占用有时候会有几百兆？

缓存的 CVPixelBuffer 需要使用 CVPixelBufferPool 来进行创建和释放。例如你自己创建 CVPixelBuffer 缓存即使你在程序中及时释放但是系统真正释放的时机可能会延迟，导致占用内存过高。

CVPixelBufferPool 的作用是提供一个缓冲区池，用于缓存一定数量的 CVPixelBuffer 对象，以便重复使用。这样，当你需要一个 CVPixelBuffer 时，你可以从池中获取一个已经分配好的实例，而不是每次都从头开始分配内存。当一个 CVPixelBuffer 不再需要时，它会被返回到池中，而不是被销毁，这样它就可以被再次使用。

更多的音视频知识、面试题、技术方案干货可以进群来看：

http://mp.weixin.qq.com/s?__biz=MjM5MTkxOTQyMQ==&mid=2257490222&idx=1&sn=19ad33a2ebf9b66bf673f50ab9192292

关键帧Keyframe

系统性地探索音视频、AIGC、区块链技术。

最新文章

【音视频】面试题集锦第 39 期｜编辑 SDK 方向

【音视频】面试题集锦第 38 期｜ iOS 渲染方向

【音视频】生产框架介绍：拍摄、编辑、上传、推流丨音视频实战经验

【音视频】面试题集锦第 37 期｜ iOS 播放器 SDK 方向

【音视频】面试题集锦第 36 期｜客户端音视频开发

【音视频】面试题集锦第 35 期｜播放器功能方案（附伪代码）

【音视频】面试题集锦第 34 期｜直播和视频播放器方向

【音视频】面试题集锦第 33 期｜面试官针对编解码方向的追问

【音视频】面试题集锦第 32 期｜面试官针对编解码方向的问题

【音视频】面试题集锦第 31 期｜面试官常用的基础问题

【AIGC】用 v0.dev 迭代开发一个极简版小红书前端，5 分钟搞定 1 天的工作量，会打字会截图就能开发网站

【AIGC】利用 AI 技术，1 个人养 1327 个账号，可行吗？

【AIGC】一条内容 19 万点赞，50 万转发，三分钟学会使用 AI 工具制作小猫跳舞视频

【音视频】面试题集锦第 29 期｜视频渲染相关各种问题

【AIGC】随便发发就点赞过万，AI 萌宠打工人，视频素材直接下载去养号做号

抽奖开奖

【AIGC】一条视频 144 万点赞，AI 萌宠时尚走秀，视频素材直接下载去养号做号

福利来了

【AIGC】ComfyUI 入门教程（10）：快捷方式和技巧

【AIGC】ComfyUI 入门教程（9）：使用 LoRA

【AIGC】ComfyUI 入门教程（8）：使用 Embeddings

【音视频】面试题集锦第 28 期｜音视频 SDK 开发 WebRTC 面试题

【AIGC】ComfyUI 入门教程（7）：SDXL 工作流和 ComfyUI 整合包

【AIGC】ComfyUI 入门教程（6）：图像修复｜AI 生成图片

【AIGC】ComfyUI 入门教程（5）：图片上采样放大｜AI 生成图片

【音视频】特效编辑等场景常用的动画系统：PAG 与 Lottie｜音视频实战经验

【AIGC】ComfyUI 入门教程（4）：ComfyUI 管理器｜AI 生成图片

【AIGC】ComfyUI 入门教程（3）：图生图工作流｜AI 生成图片

【AIGC】ComfyUI 入门教程（2）：从文本生成图像的流程｜AI 生成图片

【AIGC】ComfyUI 入门教程（1）：安装 ComfyUI｜AI 生成图片

音视频面试题集锦第 27 期｜音视频 SDK 开发 C++ 基础知识

AI 让老照片动起来・简单教程和赚钱方式｜ AI 生成视频｜ AIGC

音视频面试题集锦第 26 期｜ FFmpeg 基础和音频处理

《Stable Diffusion 倚天剑术》第 7 卷：控制 AI 模特的年龄 | StableDiffusion 实战案例

什么是 Stable Diffusion？ | StableDiffusion 基础知识

音视频面试题集锦第 25 期｜直播相关功能技术方案

音视频面试题集锦第 24 期｜直播相关技术指标优化

音视频面试题集锦第 23 期｜编码相关

音视频面试题大合集 202405

音视频面试题集锦第 22 期｜视频编码

音视频面试题集锦第 21 期

音视频面试题集锦第 20 期 | 视频编辑相关

音视频面试题集锦第 19 期｜读取纹理数据

音视频面试题集锦第 18 期｜ OpenGL 实战经验

关于 Sora

音视频面试题集锦第 17 期

音视频面试题集锦第 16 期

音视频面试题集锦第 15 期 | 编辑 SDK 架构 | 直播回声 | 播放器架构

音视频面试题集锦（第 14 期）

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉

【音视频】面试题集锦第 29 期 ｜ 视频渲染相关各种问题

1、调试 OpenGL 特效的时候图像不对，有什么调试技巧能快速排查原因？

2、在实现类似 OBS 的实时的图片、GIF 贴片叠加和替换效果时遇到了性能瓶颈，请问如何实现快速的 GIF 贴片叠加和替换？

3、iOS 动态图片如何获取原始视频？

4、自己实现播放器时利用 FFmpeg 拿到解码后数据封装成 CVPixelbuffer 缓存用于渲染，但是缓存后数据只有几帧，但为什么内存占用有时候会有几百兆？

【音视频】面试题集锦第 29 期｜视频渲染相关各种问题