人工智能 - 如何在音频文件中找到特定单词？ - 吾爱随笔录

人工智能神经网络机器学习深度学习 Python 音频处理

2021-10-27 19:18:50

我正在尝试训练和使用神经网络来检测音频文件中的特定单词。神经网络的输入是持续时间为 2-3 秒的音频，神经网络必须判断输入音频（人的声音）是否包含“你好”这个词。

我不知道使用什么样的网络。我使用了 SOM 网络，但没有得到想要的结果。我的训练数据包含大量包含“你好”这个词的声音。

有没有针对dis问题的python代码？

1个回答

在互联网上进行了一些研究后，我意识到在 python 中使用 VOSK 工具包，可以找到（检测）音频文件或实时音频流中的任何特定单词。

其它你可能感兴趣的问题