在本教程中,他们构建了一个语音识别模型,将一秒钟的音频剪辑分类为十个预定义的单词之一。假设我们将这个问题修改如下:给定一个阿拉伯语数据集,我们的目标是建立一个方言识别模型,将一个两秒的音频片段分类为使用十个预定义句子的地方方言。即对于这十个句子中的每一个,都有指代相同含义的不同短语和习语. 现在如何利用上述教程来解决修改后的问题?
这每个句子的不同短语和习语没有预定义。
在本教程中,他们构建了一个语音识别模型,将一秒钟的音频剪辑分类为十个预定义的单词之一。假设我们将这个问题修改如下:给定一个阿拉伯语数据集,我们的目标是建立一个方言识别模型,将一个两秒的音频片段分类为使用十个预定义句子的地方方言。即对于这十个句子中的每一个,都有指代相同含义的不同短语和习语. 现在如何利用上述教程来解决修改后的问题?
这每个句子的不同短语和习语没有预定义。
您链接的教程相关性不大,您的确切问题已经存在实现。
你可以使用https://github.com/swshon/dialectID_e2e,github上还有很多其他类似的实现。