2024年10月14日,中关村视听产业技术创新联盟正式批准发布团体标准《信息技术 感知无损压缩 第1部分:图像》,标准号:T/AI 129.1-2024。
AVS感知无损压缩(Perceptual Lossless Compression,以下简称PLLC)标准制定工作自2021年12月启动,中国科研机构和企业集体创新,专注于解决“8K+”超高清视频信号传输中高速数据收发的性能瓶颈问题。经过三年的深入研发,AVS视频组研发了一系列 “超低延时、硬件友好、主观无损”的轻量级图像压缩技术,并最终形成团体标准。主观质量测试表明,PLLC达到了国际领先水平,标志着中国在视频编解码领域实现了又一重大突破。
一、PLLC关键技术特性
图1 PLLC参考软件平台(HIM)信号处理流水
PLLC标准定义了两个编码档次,分别为接口档次和帧存档次。接口档次主要面向信号传输接口的硬件芯片(Application Specific Integrated Circuit,ASIC)设计,帧存档次则可广泛应用于主观无损或信号无损质量等级的图像缓存,减轻图像处理系统中的内存与带宽压力,提升系统总体性能。
如图1所示,PLLC标准的关键技术可分为信号处理、模式预测、量化、系数编码和码率控制五个部分组成。下面简要介绍每部分的实现方案和设计目的:
1. 信号处理:PLLC支持将信号切分为等尺寸的矩形片进行并行处理,编码过程中最小的单元为16×2的一组像素。这种处理方式使得PLLC在保持高压缩效率的同时,能够实现超低延时的数据传输。
2. 模式预测:PLLC包含点预测、普通帧内预测和块复制帧内预测三类预测模式,通过比特代价和重构失真的综合评估,获得编码单元的最优编码模式。这一设计支持了高度并行的硬件处理,提高了编解码的效率。
3. 量化和系数编码:PLLC使用移位量化和半定长系数编码,在保证低硬件成本的前提下实现对预测残差的能量聚集。此外,PLLC还支持在特定点位逐像素点的量化参数微调,显著优化纹理细节的主观重建质量。
4. 码率控制:码率控制是恒定码率压缩的关键模块,PLLC提出一种基于历史先验自适应更新的码率估计模型,通过对纹理特征建模导出其预分配的编码比特数,随后结合视觉无损的比特下界与位流缓冲的比特上界进行适当放缩,最终映射导出实际的量化步长。通过上述码率控制技术,实现了稳定的恒定码率传输和视觉无损的主观质量。
二、主客观性能测试
在AVS工作组遴选的27组测试序列中,PLLC标准参考软件表现出了优秀的客观重建质量。如图2所示,在ISO 29170-2国际主观质量标准的判定中,PLLC闪烁测试有25/27条序列达到主观无损的判定标准,并排测试全部27/27条序列均达到主观无损。
图2 客观重建数据与主观评测结果,序列17为噪声序列
在测试的27组信号中,难度最高的10条信号被进一步用来进行PLLC与国际同类压缩标准DSC的主观质量对比,其中PLLC的主观质量在闪烁测试中与之持平(均为8/10条序列达到主观无损),在并排测试中更优(PLLC: 10/10; DSC: 9/10)。这一对比结果证实了PLLC标准达到了国际领先水平,为中国在国际视频浅压缩编码领域的竞争中赢得了重要的一席之地。
三、系统产品部署
国内多家厂商已开始基于PLLC的相关硬件产品开发与部署。作为国内领先的控制台设计与制造商,北京铁力山科技股份有限公司率先基于现场可编程门阵列(Field Programmable Gate Array,FPGA)实现了PLLC标准的部署,展示了该标准在压缩效率与硬件适配上的卓越表现。
北京大学视频与视觉技术国家工程研究中心与铁力山紧密合作,共同研发了基于PLLC的高速实时FPGA编解码系统,如图3所示。该系统能够处理四路实时采集的4K视频,通过PLLC编码器进行实时压缩后,经由局域网传输至接收端,随后通过FPGA实时解码器解码并输出至显示屏。该系统可以实现3倍无损压缩效果,充分展示了PLLC标准在高速高分辨率视频高效视频压缩传输应用中的强大性能。
(a)
(b)
图3 (a)系统结构图,(b) 播放示意图
四、未来展望
AVS感知无损压缩团体标准的成功发布,不仅为“8K+”超高清视频海量信号提供了超低延时传输和处理的全新国产化技术方案,也为我国视频行业的自主创新和高效发展奠定了坚实基础。随着技术的不断成熟和应用的不断拓展,AVS感知无损压缩技术将在全球范围内推动超高清视频产业的快速发展,为观众带来更加丰富、震撼的视觉体验。
深圳龙岗智能视听研究院
人工智能 | 超高清
产业创新 | 技术孵化 | 成果转化