假设房间里有 3 个人。他们每个人都有独特的音色。我想通过音色来识别人,并知道谁在说话。
图书馆通过他们的声音来区分人
信息处理
声音的
语音
2021-12-22 23:51:19
1个回答
将一段长的连续录音分割成只有一个说话者在说话的块的任务 - 没有关于每个说话者的语音特征的任何先验知识 - 称为“说话者分类”。您可以在wikipedia 页面上找到研究代码的链接。
如果您有每个声音的先前录音,并且宁愿进行分类,这是一个稍微不同的问题(说话人识别或说话人识别)。此处提供了相关的软件工具(请注意,像 Sphinx 或 HTK 这样的通用语音识别包足够灵活,可以被哄骗去做)。
其它你可能感兴趣的问题