据我了解,您的项目是检测和区分家庭环境中的鼻息、咳嗽等声音。因此,您对其他声音不感兴趣,例如人类语音或其他可能的噪音。
如果这是正确的,一种表面上的方法是使用学习方案和一组有效的特征来classify系统的输入声音。一个可以告诉您特定音频帧(馈送到系统)是否属于您正在寻找的类型的功能。
关于您的项目的一个有希望的事实是,人体发出的声音通常与背景声音截然不同。这是男性音轨的特殊特征的结果,它可以拥有(或多或少)独特的属性。
因此,我建议您执行以下步骤:
- 收集您正在寻找的声音的足够数据库,这些声音由不同类型的人(男人、女人、儿童、老人等)产生,全部由您自己的麦克风和高质量的。您还应该收集相反类别的数据库:您希望省略的那些。
- 开始分析声音。这可能有点技术性,您需要搜索可以在 2 个类之间产生合理差异的功能。这可能是基音周期、倒谱系数、谐波能量衰减率等特征的组合。顺便说一句,找到有用的功能可能是该项目的最重要步骤。
- 使用像 SVM 这样的学习方案(分类例程)来分离类。实际上,您将在收集的数据库上训练机器以对新的测试输入进行分类。
- 查看真实的新数据。使用训练数据库中未包含的音频帧测试您的分类并观察结果。通常会有一小部分错误,但应该通过修改特征和训练集或更改分类方法来修改大错误。
我希望这会有所帮助,祝你好运!