信息处理 - 音频隐写术：用于源识别的听不见的音频水印 - 吾爱随笔录

音频隐写术：用于源识别的听不见的音频水印

信息处理声音的调制源分离超声波水印

2022-02-09 16:05:55

什么是相对听不见的音频水印技术，可以在播放音乐的顶部覆盖宽带音频信号，而无需分析音乐以进行低比特率源识别？理想情况下应该能够抵抗多路径、混响和共振。

我不想做任何类型的 DRM，所以我不关心重采样、时间压缩或频移——我只想实时找出正在播放的源，而不会给信号添加太多可听噪声.

目前我在音乐上播放一个低比特率的超声波信号，用 GMSK 调制，载波频率为 19500Hz，但高频衰减很快，高频仍然可以听到。

我正在考虑广播一个听起来像粉红噪声的超宽带 PN 序列。我只需要维持每秒大约 3-4 字节（24-32 位）的传输速率。但是如果我延长符号长度，我会担心环境噪音。

如果我之前需要对输出缓冲区进行预分析，我可以添加延迟，但我希望我可以引入一个非常柔和的全谱“嘶嘶声”或嗡嗡声，它可以携带我的源识别信号。

我不需要在沉默期间追踪信号源，所以总会有一些音乐来掩盖我的信号。

更新：我发现了一些先前的音频隐写术工作，但我不知道实时调制（尤其是在低功耗嵌入式设备上）的权衡是什么，以及这是否可以在没有查看的情况下工作-在输出缓冲区前面。

2个回答

柏图斯。首先，感谢您将我的github 库作为更新附加到其他读者的问题中。我刚刚看到你的问题。

根据我自己的经验，回声隐藏方法对于额外的回声很脆弱，对于混响也是如此。使用 PN 序列的简单扩频模型会引入一些噪声，将数据嵌入到高频带中，因此隐藏的数据通常是可听的，并且对低通滤波器没有鲁棒性。

诸如余弦变换和小波变换之类的变换经常用于音频水印。将没有 PN 序列的扩频方法应用于第三级小波分解( A3 ) 的近似系数将非常有效地抵抗除高通滤波器之外的许多常见攻击，并且几乎完全不可察觉。另一方面，将数据隐藏到不同级别的细节系数上，在鲁棒性和透明度之间取得了不同的平衡。如果你有 Wavelet Toolbox，这些分解在 Matlab 中很容易完成。但是，我还没有将我的相关作品上传到github。

我们还没有使用实时音频，但我知道所有这些技术也可以应用于它们。我不确定你是否已经解决了你的问题，但如果你有任何进一步的问题，你可以在评论中指出。我不像这个网站上的许多人那样是数字信号方面的专家，所以也非常欢迎不同的意见。

最好的祝福。

我对这个话题不是很熟悉，但我在处理一个不同的问题时遇到了这个概念——似乎使用“回声隐藏”或“回声水印”会在 IEEE 的网站上返回大量结果。据我所知，这涉及在您的信号中添加一些听不见的独特回声特征，以后可以使用倒谱提取这些特征。

一篇这样的论文，虽然我认为这不是一种“盲目”的技术。

其它你可能感兴趣的问题

上一篇如何更好地同步来自 LED 和 TTL 脉冲的信号？下一篇使用循环自相关识别循环平稳信号是否有噪声