“梅尔刻度是根据人耳对音高感知的总结”
音频频谱分析
—
在音频频谱分析时我们可以看到横轴为频率纵轴为功率的频域功率谱,
默认情况下横轴是采用线性坐标的,
也就频率的间隔是均匀的,
可以看到此时频率分析范围为0-24kHz,
每个网格均匀间隔2kHz
但人耳对声音的感知并不是线性的,
人耳对低频的感知更加敏感,
对高频信号较不敏感,
因此需要对坐标进行变换才能更好适应听力环境。
对数坐标
—
通常我们对低频进行拉伸对高频进行压缩会采用对数坐标,
为了对比线性坐标与对数坐标的区别,
我们使用“可编可算”APP编写一段对比程序可以查看,
并进行绘图对比,
示例代码如下
执行该程序,
查看绘图对比结果
可以看到对数坐标虽然对低频进行了延展,
对高频进行了压缩,
但低频变得过于延展,
并在70%的位置开始迅速压缩,
但也并不能适应听力环境,
梅尔刻度
—
梅尔刻度是对人耳对音高感知的刻画,
根据经验总结,
梅尔刻度公式如下
我们修改一下程序,
增加梅尔刻度对比
执行后结果如下
新增梅尔刻度为紫色曲线,
该曲线在低频可以保持较好线性,
并对高频进行压缩,
是更加符合人耳听力场景的变换,
我们使用“音频分析师”时可以直接在频率配置中找到对数坐标,
修改后即可按照梅尔刻度进行频谱分析,
可以看到修改后频率坐标变换为非线性