我正在寻找一个数据集,其中包含来自世界各地的不同语言的音频剪辑,包括一个指示剪辑来自哪个国家的标签。
这样的数据集存在吗?还是有一种简单的方法可以一起破解?
Topcoder 举办了口语识别比赛。他们发布了一个包含 176 种语言的数据库。可以在此处找到数据集和相关资源。