我想创建一种机制,从电视节目和其他类型的 Torrent 名称中提取适当的标题和可能的其他元数据。您可能知道,Torrent 名称包含各种废话,例如点和其他不相关的字符串。
具体来说,我有大约一万个正确转换种子名称到正确标题等的数据。我应该以某种方式使用这个“训练集”。
我应该采用什么机器学习方法?我知道这个问题有正则表达式类型的解决方案,但我想找到一个机器学习解决方案。
我想创建一种机制,从电视节目和其他类型的 Torrent 名称中提取适当的标题和可能的其他元数据。您可能知道,Torrent 名称包含各种废话,例如点和其他不相关的字符串。
具体来说,我有大约一万个正确转换种子名称到正确标题等的数据。我应该以某种方式使用这个“训练集”。
我应该采用什么机器学习方法?我知道这个问题有正则表达式类型的解决方案,但我想找到一个机器学习解决方案。