音频隐写术:用于源识别的听不见的音频水印

信息处理 声音的 调制 源分离 超声波 水印
2022-02-09 16:05:55

什么是相对听不见的音频水印技术,可以在播放音乐的顶部覆盖宽带音频信号,而无需分析音乐以进行低比特率源识别?理想情况下应该能够抵抗多路径、混响和共振。

我不想做任何类型的 DRM,所以我不关心重采样、时间压缩或频移——我只想实时找出正在播放的源,而不会给信号添加太多可听噪声.

目前我在音乐上播放一个低比特率的超声波信号,用 GMSK 调制,载波频率为 19500Hz,但高频衰减很快,高频仍然可以听到。

我正在考虑广播一个听起来像粉红噪声的超宽带 PN 序列。我只需要维持每秒大约 3-4 字节(24-32 位)的传输速率。但是如果我延长符号长度,我会担心环境噪音。

如果我之前需要对输出缓冲区进行预分析,我可以添加延迟,但我希望我可以引入一个非常柔和的全谱“嘶嘶声”或嗡嗡声,它可以携带我的源识别信号。

我不需要在沉默期间追踪信号源,所以总会有一些音乐来掩盖我的信号。

更新:我发现了一些先前的音频隐写术工作,但我不知道实时调制(尤其是在低功耗嵌入式设备上)的权衡是什么,以及这是否可以在没有查看的情况下工作-在输出缓冲区前面。

2个回答

柏图斯。首先,感谢您将我的github 库作为更新附加到其他读者的问题中。我刚刚看到你的问题。

根据我自己的经验,回声隐藏方法对于额外的回声很脆弱,对于混响也是如此。使用 PN 序列的简单扩频模型会引入一些噪声,将数据嵌入到高频带中,因此隐藏的数据通常是可听的,并且对低通滤波器没有鲁棒性。

诸如余弦变换和小波变换之类的变换经常用于音频水印。将没有 PN 序列的扩频方法应用于第三级小波分解( A3 ) 的近似系数将非常有效地抵抗除高通滤波器之外的许多常见攻击,并且几乎完全不可察觉。另一方面,将数据隐藏到不同级别的细节系数上,在鲁棒性和透明度之间取得了不同的平衡。如果你有 Wavelet Toolbox,这些分解在 Matlab 中很容易完成。但是,我还没有将我的相关作品上传到github。

我们还没有使用实时音频,但我知道所有这些技术也可以应用于它们。我不确定你是否已经解决了你的问题,但如果你有任何进一步的问题,你可以在评论中指出。我不像这个网站上的许多人那样是数字信号方面的专家,所以也非常欢迎不同的意见。

最好的祝福。

我对这个话题不是很熟悉,但我在处理一个不同的问题时遇到了这个概念——似乎使用“回声隐藏”或“回声水印”会在 IEEE 的网站上返回大量结果。据我所知,这涉及在您的信号中添加一些听不见的独特回声特征,以后可以使用倒谱提取这些特征。

一篇这样的论文,虽然我认为这不是一种“盲目”的技术。