人工智能 - 这种声音分类有多难？ - 吾爱随笔录

这种声音分类有多难？

人工智能分类训练执行

2021-10-27 00:54:55

我想要一个麦克风来接收我周围的声音（假设半径超过 3 英尺），但忽略我办公桌上发出的声音，例如纸张的沙沙声、点击鼠标和打字、我的手在桌子上刷、放放下笔等

人工智能将这些声音与周围的声音区分开来有多难，比如有人敲我的门，或者远处的随机响亮的声音？你将如何实现这一点？预训练的模型是否有可能实现这一点，并为大多数坐在办公桌前的人可靠地工作？我没有任何人工智能方面的经验。

1个回答

我认为，如果您获得了数据集，那么标准的一维卷积神经网络将在一定程度上起作用。并不是说它会接收到附近声音的某些属性。它只会记住所有来自您办公桌的声音。我认为编码部分将是非常标准的东西。但是收集数据会很困难。您必须获得一个非常大的标记数据集，其中包含来自您办公桌的声音以及超过 3 英尺半径的声音。该数据集必须是现实的并能代表现实世界。获取该数据集将非常棘手，但如果您在家里放置多个麦克风以三角测量所有声音的确切位置，这是可行的。它就像 GPS，但使用声波而不是光波。

其它你可能感兴趣的问题

上一篇玩不完全信息游戏的人工智能如何决定他们的开局策略？下一篇记忆机制（读取和写入）在神经图灵机中是如何工作的？