婴儿哭声识别对距离很有效

信息处理 过滤器 信号分析 音频处理 声音识别
2022-02-17 03:22:49

我正在使用深度学习算法、Raspberry Pi 和麦克风作为声音传感器构建婴儿哭声检测系统。

当婴儿开始哭泣时,系统应该检测到哭声。当我将麦克风放在婴儿附近时效果很好,但是当麦克风离开时,我无法检测到声音。

请向我建议任何技术来检测最大 3 米范围内的声音。

4个回答

要提高基于驻极体麦克风的声音捕捉系统的效率,您可以:

  • 使用电子麦克风前置放大器。
  • 通过抛物面聚焦天线增加麦克风的方向性。
  • 使用多个麦克风并应用自适应降噪。

这个问题非常广泛,即使不了解系统内部(网络的类型和功能有很大的不同),也不可能给出一个很好的答案。不过,我会尝试的。

最重要的问题不是“建议检测最大 3 米范围内的声音的技术”,而是要了解它为什么不起作用。你试过调查它吗?可能有很多可能的原因:

  • 网络过度拟合干净/响亮的数据,并对其进行了训练。因此,当麦克风放置在更远的距离时,室内反射会取代直达声,并且信号会更加模糊。尝试记录 3m 范围内的训练数据并将其添加到训练中。另外,为了防止过拟合,尝试使用一些正则化,看看它是如何工作的。
  • 网络取决于输入信号的能量。我真的不认为是这种情况,因为在一个普通的房间里,1 米和 3 米处的 SPL 之间的差异大约是 5 dB。无论如何,您可以尝试增强在 3m 处记录的输入信号,将其馈送到网络,看看它是否工作。如果是这样,那么使用更安静的数据进行简单的再训练,或者可能是 AGC 会有所帮助。
  • 麦克风的增益非常低,或者可能噪音太大。试着听听你录制的声音。如果 SNR 不是很好,那么只需选择声卡和麦克风的不同组合即可。
  • 用于根据网络输出做出决策的阈值不是最优的。试着计算一条ROC曲线,看看能不能调整到更优的工作点。

    也有不同的可能性,但现在尝试调试它:

    • 聆听 1 米和 3 米处的实际录音。比较它们的频谱和响度。
    • 使用在更远距离记录的更多数据重新训练网络。
    • 如果您的训练数据量足够,请尝试使用一些正则化技术。
    • 尝试以 1m 到 3m 的步长移动麦克风。绘制精度与距离的关系图。听例子,分析录音——这会告诉你很多。

为了补充 Fat32 的建议,如果您的信号嘈杂,请使用本噪声较低的麦克风。

我建议你先做一些需求计算。

让我们假设婴儿哭声在 100Hz 时有很多能量

在 20 摄氏度的空气中的声速约为 340m/s。

这给出了大约 3.4 米的波长,所以你需要的距离小于一个波长。

假设一个婴儿在一个房间里,没有多大,婴儿哭声可能具有一些驻波特征。如果是这种情况,房间内会出现更响亮和更安静的地方,它们仅与婴儿和麦克风之间的距离松散相关,如果存在相关关系,它将与微弱成比例。1/r

我建议你在这些方面做更多的实验。让一些假设更具体,比如婴儿哭泣的频率内容。100Hz 可能太低了。1000Hz 改变了很多一阶物理假设。移动麦克风是否具有关系,或者房间内是否有响亮和安静的地方。 1/r

由于其他一些答案暗示了一些放大,可以容忍多少放大。额外的麦克风可以提供一些分集增益,但应考虑相距多远以及如何处理。

你真的应该更好地了解你的问题,因为这会带来更好的解决方案。