如何衡量两个单词发音的相似度?

人工智能 自然语言处理 自然语言理解 语音合成
2021-10-20 09:39:00

我想知道如何测量两个单词的发音。这两个词非常相似,只有一个元音不同。我知道有,例如,汉明距离或 Levenshtein 距离,但它们测量单词之间的“一般”差异。我也对此感兴趣,但主要是我想知道它们听起来有何不同。我认为必须有这样的东西来测试文本到语音的结果?

Best 甚至是一个在线资源,我可以在其中输入这两个词。

1个回答

有一些工具可用于手动比较发音,但都在某些方面受到限制。根据您的用例,您可能对以下内容感兴趣:

  • Wikspeak:一种将(单个)单词转录成国际音标并生成发音的工具。提供了一个网络演示,尽管它对浏览器版本有点敏感。
  • espeak-ng:提供一个 CLI 工具,可以进行文本到语音或文本到 IPA 的转录
# use the —-ipa flag to display the inferred IPA transcription
espeak-ng -v en-US --ipa "horse”
# => hˈɔːɹs
espeak-ng -v en-US --ipa "hoarse"
# => hˈoːɹs

如果您想要一个更自动化的解决方案,您可以查看像eng-to-ipa这样的 Python 库来进行 IPA 转录(包括当一个单词可以映射到多个 IPA 转录时的消歧)。然后,您可以尝试将编辑距离测量应用于 IPA 转录,以估计发音的相似性。