从种子名称中提取标题

数据挖掘 机器学习
2022-02-25 10:06:39

我想创建一种机制,从电视节目和其他类型的 Torrent 名称中提取适当的标题和可能的其他元数据。您可能知道,Torrent 名称包含各种废话,例如点和其他不相关的字符串。

具体来说,我有大约一万个正确转换种子名称到正确标题等的数据。我应该以某种方式使用这个“训练集”。

我应该采用什么机器学习方法?我知道这个问题有正则表达式类型的解决方案,但我想找到一个机器学习解决方案。

0个回答
没有发现任何回复~