场景:一群人必须总结他们听到的演讲的特定部分。他们每天都会听到一个新的演讲,并且小组的多个成员可能正在听同一个演讲。
问题:您可以采用什么机器学习算法或方法来链接引用完全相同语音的完全相同部分的摘要?
为什么这个问题很有趣:大多数分类问题都处理大量实例而只处理少数类。这个问题是关于为越来越多的类(特定语音的特定部分)处理非常少的实例(1-5)。
场景:一群人必须总结他们听到的演讲的特定部分。他们每天都会听到一个新的演讲,并且小组的多个成员可能正在听同一个演讲。
问题:您可以采用什么机器学习算法或方法来链接引用完全相同语音的完全相同部分的摘要?
为什么这个问题很有趣:大多数分类问题都处理大量实例而只处理少数类。这个问题是关于为越来越多的类(特定语音的特定部分)处理非常少的实例(1-5)。
是的,有几种方法。我建议阅读 Siamese Networks 论文。从那里您可以检查更现代的方法,例如原型网络等。一般来说,您正在寻找的关键字是很少的镜头学习。所有这些方法基本上都依赖于找到两个或多个输入之间的相似性。一个输入是您的未知输入,其他输入是您的已知样本。您的网络将预测对应于最大相似度的类。