“Lena”、“Mandrill”和“Cameraman”等图像的音频等价物是什么?

信息处理 图像处理 声音的 声音
2022-01-01 23:58:03

我不知道如何称呼这些图像,但它们在图像处理领域中经常被用作标准示例来显示特定操作的输出。这是将 Lena 描述为“标准测试图像”的页面的链接是否有类似的规范音频剪辑用于演示某些音频过滤器或操作的效果?

4个回答

我能想到的最接近的例子是 Suzanne Vega 的“Tom's Diner”的开始,它已用于 mpeg-1 第 3 层开发,并且仍然偶尔用于演示音频编解码器。

音频处理是一个很大的领域,但特别是在语音处理中,被称为哈佛句子的开放样本数据库被广泛使用。哈佛句子是美式英语句子的语音平衡集合。其他语言也存在许多等效的数据库。

哈佛句子演讲的实际文件可以在这里找到。

我还认为 NIST 数据库在语音识别任务方面非常受欢迎。事实上,它是在年度挑战中比较新算法和技术的标准。

此外,MATLABload handel包含的GFHandel - Hallelujah片段非常常用。

欧洲广播联盟 (EBU) 的声音质量评估材料 (SQAM) 资源非常受欢迎。https://tech.ebu.ch/publications/sqamcd