为什么我们选择 44.1K 和 48K?音频采样率的历史回顾

科技   2024-11-10 19:07   湖北  

  
在讨论不同采样率的使用时,我突然意识到,历史在采样率的选择上发挥了重要作用,即使是早期的数字选择,与我们当时所使用的模拟规格相比,也是非常出色的。在这篇文章中, Mike Thornton 根据他在英国专业音频领域 45 年的经验提出了自己的观点。



考虑传输路径
无论时间长短,在考虑我们用于完成特定任务的技术时,参考交付规格和内容的消费方式是非常有意义的,这可以为我们选择所需的设备和技术提供信息和指导,使我们能够达到或最好超过所需的交付规格和平台。



频率响应:40Hz 至 15kHz +2.0dB 至 -2.5dB

啸叫和颤动:不超过 0.12%。这对数字世界并无影响,但啸叫和颤动是对速度变化的衡量,是音频录制和回放中不希望出现的。啸叫是指速度的缓慢变化,而颤动则是指速度的快速变化。这就要求对机器进行良好的机械维护。

失真:+8dBu、1kHz 时为 2%。由于这是磁带,随着音量的增加,失真会逐渐增加,而模拟电路的失真则相当不错,通常在 +18dBu 以下为 0.1%。

信噪比:45dB 未加权峰值电平。请注意,我们的净空为 +8dBu,因此本底噪声必须超过 -37dBu!

请记住,这些都是真实的日常数据。我们还能做得更好吗?是的,但这需要频繁的排线和清洁,而一个地方电台可以轻松拥有 20 到 30 台 ? 英寸录音机,这并不现实。后来,在皮卡迪利电台,我们选择了 Studer B67,它在电气和机械方面都能保持更长时间的排列。但是,我们的预算无法满足 A80 等录音机的需求。

在音乐方面,我们播放黑胶唱片,而 “光盘复制器 ”必须符合这一规格......

频率响应 40Hz 至 15kHz +/-2.5dB

啸叫和颤动:不超过 0.12

信噪比:55 分贝非加权峰值电平

然后是电子工作室路径。这将通过从话筒前置放大器输入到录音室输出,再到发射机的传输链进行测量。

频率响应 40Hz 至 15kHz +/-1.0dB

在话筒前置放大器提供 70 分贝增益时的信噪比:46dB 未加权峰值电平,等效输入噪声为 -116dB。这通常不是问题,因为我们使用的 Neve 话筒前置放大器要比这好得多,但更经济实惠的工作台就没那么好了,尤其是在高增益时,因此实际规格是这样的。

作为参考,线路电平输入的信噪比必须超过 63 分贝。

我们还必须进行全循环测试。虽然皮卡迪利电台是一家 24 小时营业的电台,但我们还是在半夜进行了测试。因此,这是从演播室台到发射机,在我们的情况下使用的是无线电链路,但更常见的是为 “音乐 ”优化的铜质电话链路,通过发射机,再通过离线检查接收机回到演播室。

我不记得当时的规格是多少,但我记得在调频广播的好天气里,我们很幸运能获得 45 分贝的信噪比。

就是这样。在所有模拟路径的时代,我们受制于消费者的传输系统以及信号流中的关键要素,尤其是模拟磁带录音机。即使是排列整齐的 ? 英寸磁带机,信噪比和失真程度也意味着我们只有 45 分贝这个非常小的窗口。就是这样。

是的,我知道,在不采用降噪措施的情况下,经过大量的工作,可以将其提高到 50 到 55 分贝左右。在我的记忆中,杜比 A 可以给你额外的 10 分贝,但我希望这能在一定程度上解释为什么即使是早期的数字音频平台也比我们的模拟选择要好得多。

数字时代的到来

随着数字音频录音机和信号链的出现,啸叫和颤动现象消失了,净空和失真变成了二进制,要么非常好,要么当你达到数字净空时就会非常糟糕,小到 0.1dB 都会造成巨大的差异。有了 16 位数字音频,信噪比从 45dB 跃升至 96dB。从 20Hz 到 20kHz 的频率响应变得非常平坦。不会出现低频颠簸,也不会因为磁头磨损而导致高端音质变差。是的,对于数字音频来说,抗混叠滤波器的设置接近采样率的一半时,情况会有些 “不稳定”,但总体而言,16 位/44.1 千赫兹采样率的音频效果令人惊叹,尤其是与我们在此之前已经习惯的模拟世界相比。无噪声 “世界的概念,动态范围的显著增加,以及从消费者的设备到整个过程中都没有 ”哗哗 “声和 ”嗡嗡 "声,都改变了游戏规则。

但受益的不仅仅是广播行业。随着光盘的诞生,音乐的传输也随着 CD 转向数字化。对最终用户来说,CD 不仅可以在不压缩数据的情况下将高质量的音频一直传送到最终用户手中,而且还非常方便,即使在早期抗混叠滤波器还没有现在这么好的时候,CD 也是利大于弊。但不管你喜不喜欢,CD 作为一种传输格式,巩固了 44.1K 和 16 位作为高质量和非常方便的音乐传输格式的地位。

为什么是 44.1K 和 48K 采样率?

回到采样率的选择上,你可能还想知道为什么我们最终采用了小于整数的采样率。如果是这样,请查看我们的文章《为什么采样率以 44.1K 或 48K 为基础?你会发现,历史和数字音频诞生之初的硬件条件,再加上一些数学计算,让我们最终选择了 44.1K 和 48K 采样率。

在英国,电台选择了 44.1K,因为许多内容都来自 CD,所以使用 44.1K 作为标准采样率是合理的。此时,我正在为 BBC 国家广播电台剪辑和混音。由于 DAT 并不完全可靠,所以当他们播放节目时,会同时运行主带和备份带,以防主带出现问题。

CDR 变得可靠后,我们转而为预先录制的节目提供 CD,在过渡到播放系统之前的一段时间里,这些节目都是现场直播的,CD 可以翻录并上传到播放系统。最后,文件上传系统绕过了在任何媒体上传送节目的需要,但规格仍然是 44.1K/16bit。但请记住,这仍然比模拟调频传输系统要好得多,我们现在仍然使用模拟调频传输系统,与之并行的是 DAB,它虽然提供了端到端的数字路径,但使用了大量的数据压缩来使其工作,而且信号覆盖范围仍然不够好,甚至无法在建筑物内可靠地收听 DAB!

从广播的角度来看,CD 是一种极具成本效益的方式,可以通过非常方便的传输系统向最终用户提供高质量的音频。但是,与用于广播的 DAB 一样,苹果 iPod 等个人数字音频播放器带来的额外便利也意味着它的实用性,尤其是在早期,为了在早期设备上播放足够的内容,有必要对数据进行压缩。

当涉及到图片内容时,48K/16 位被确定为音频路径,尽管数学计算表明 44.1K 也可以工作。有人认为,采样率从 44.1K 稍微提高到 48K,意味着早期抗锯齿滤波器的副作用减小了,因此质量上的好处是值得的,电视的大部分输出也就不那么依赖 CD 了。

为什么要采用这些采样率?


我们中的一些人还记得,采样率转换听起来比现在糟糕得多。我们倾向于以最终交付产品的采样率进行录音 。

艾伦-哈迪曼(Alan Hardiman)引用鲍勃-卡茨(Bob Katz)在《音频母带》(Mastering Audio)一书(第三版,第 23 章)中的话说,不同采样率下再现音频质量的差异与数模转换器中低通滤波器的陡度有关。

“位于或接近耳朵高频极限的陡峭低通滤波器会与耳蜗滤波器相互作用,产生前回声,耳朵会将其理解为瞬态响应的损失,从而掩盖了声音的锐利度或清晰度"。


这只是两个例子,但毫无疑问,在早期的数字音频时代,采样率转换和抗混叠滤波器都没有现在这么好,因此,为了获得更高的质量,使用任一种采样率的倍数而不是从一种采样率转换到另一种采样率是合理的。据我们了解,正是这些限制造就了 44.1/88.2/176.4 和 48/96/192 采样率范围。

决定在制作过程中使用何种技术的另一个因素是,你是否正在处理已经是 44.1/48 格式的内容。直到最近,在后期制作中,尤其是在电视制作中,大部分内容都是 48K 的。这时,是否值得使用更高的采样率和比特深度就值得商榷了。然而,在录制和混音专辑项目时,如果不是全部,也是大部分内容都是在高品质录音室中获得的,那么使用更高的采样率和比特深度就更有价值了。

如今,随着存储成本的降低、抗锯齿滤波器和采样率转换技术的大幅改进,使用 96K/24Bit 已成为一种相当普遍的格式,无论最终交付的采样率如何,但在早期,这一点非常重要。

那么,为什么没有更多人使用更高的采样率呢?

我们在 2019 年对近 2000 名专业人士和业余音频录制和混音爱好者进行了调查,结果显示,只有五分之一的人表示,他们会在 44.1kHz/48kHz 以上进行录制和混音。我们对两类人进行了调查,一类是专业人士,另一类是业余录音和混音爱好者,在这两种情况下,大多数人都选择以 44.1kHz 或 48kHz 进行录音。

在投票结果的评论中,“mattjhuber ”说...

“保真度的提高微乎其微,不足以证明电脑性能和存储空间的损失是合理的"。

Joel.d "发表了一条有趣的评论...

“我尽量说得好听一点,因为我已经厌倦了这种争论。问题是,大多数 “专业人士 ”已经不再是专业人士了。恕我直言,现在这个行业里的大多数人都是白痴,所以他们不知道也不明白为什么要不计代价和后果,尽可能以最好的方式做事"。

但毫无疑问,这些好处是存在的,而且现在比以往任何时候都更容易实现,因为计算机的功能越来越强大,能够处理更高的处理要求和处理更高的采样率内容,同时还可以获得更大的存储设备,而且成本效益也更高。正如 “Joel.d ”在我们的投票结果评论中所说的那样...


“事实上,任何乐器的所有部分频率都会有相当大的快速变化。在许多情况下(钢琴、打击乐等),这种变化非常快、非常强,而且在 20K 以下就能辨别出来。44.1 重构滤波器只能提供所有这些变化的平滑版本--没有足够的采样点来真正捕捉声音的这一重要部分。有些结果相位偏移了一点,有些结果与乐器的表现不符。现在将其通过混响或 IIR 滤波器处理,不准确度将成倍增加。高采样率能更好地呈现话筒中的信号(20K 以上的信号有很多),并能减少信号在滤波器中颠簸几百次后出现的情况。

现在有一种说法是,所有的信号都必须降到 44.1,那为什么还要占用那些(极其便宜的)存储空间呢?即使是降采样,所有的误差也不会在滤波器和混响中积累起来。你只能平滑一次这些部分。


希望在这篇文章中,我能够提供一些背景资料,说明我们从何而来,在数字技术的早期,尽管事情并不完美,抗混叠滤波器和采样率转换不是很好,但即便如此,数字音频在很多方面都比之前的模拟音频好得多。

好消息是,早期数字音频所存在的大部分(如果不是全部)缺陷现在都已成为过去。你可以选择使用更高的采样率和比特深度,而不会因为电脑无法处理增加的负载、硬盘存储空间不足、滤波器和采样率转换不够理想而烦恼。

话虽如此,但归根结底,这还是你自己的选择,但希望你现在在做出选择时,能更清楚地了解其中的各种因素,以及为什么当时会做出这样的选择。

为什么我们选择 44.1K 和 48K?音频采样率的历史回顾

https://www.audioapp.cn/thread-226810-1-1.html

(出处: 音频应用)

音频,音响,乐器设备购买群:50691091


  二手设备交易群:628548312


音频应用(音响设备,键盘,合成器,效果器,声卡,耳机等)



招募音频合作代理 微信:yinpinyingyong


备注:资源互换,有兴趣同学联系客服


音频应用官网会员购买正版音源两种途径:第一种,通过网站首页的分享链接购买,享受插件联盟最低价格,第二种:联系客户购买,我们与xchangeb2be合作,可以享受优惠(针对网站会员)!



音频应用
音频应用官网以音频,音响,乐器,话筒,放大器,接口,二手音频,软硬件等提供音频信息及资讯等方面的交流-关注音频应用公众号,谢谢!
 最新文章