我想要一个麦克风来接收我周围的声音(假设半径超过 3 英尺),但忽略我办公桌上发出的声音,例如纸张的沙沙声、点击鼠标和打字、我的手在桌子上刷、放放下笔等
人工智能将这些声音与周围的声音区分开来有多难,比如有人敲我的门,或者远处的随机响亮的声音?你将如何实现这一点?预训练的模型是否有可能实现这一点,并为大多数坐在办公桌前的人可靠地工作?我没有任何人工智能方面的经验。
我想要一个麦克风来接收我周围的声音(假设半径超过 3 英尺),但忽略我办公桌上发出的声音,例如纸张的沙沙声、点击鼠标和打字、我的手在桌子上刷、放放下笔等
人工智能将这些声音与周围的声音区分开来有多难,比如有人敲我的门,或者远处的随机响亮的声音?你将如何实现这一点?预训练的模型是否有可能实现这一点,并为大多数坐在办公桌前的人可靠地工作?我没有任何人工智能方面的经验。
我认为,如果您获得了数据集,那么标准的一维卷积神经网络将在一定程度上起作用。并不是说它会接收到附近声音的某些属性。它只会记住所有来自您办公桌的声音。我认为编码部分将是非常标准的东西。但是收集数据会很困难。您必须获得一个非常大的标记数据集,其中包含来自您办公桌的声音以及超过 3 英尺半径的声音。该数据集必须是现实的并能代表现实世界。获取该数据集将非常棘手,但如果您在家里放置多个麦克风以三角测量所有声音的确切位置,这是可行的。它就像 GPS,但使用声波而不是光波。