是否有任何 NLP/文本挖掘技术用于识别新闻标题主题的参考资料?

人工智能 机器学习 深度学习 自然语言处理 参考请求
2021-11-15 02:00:11

我希望使用 NLP 或文本挖掘从给定的新闻标题中提取中心主题。有没有朝这个方向发展的参考?

这是一个例子。假设我有以下新闻标题。

简介-Dynasil Corporation Of America 报告第二季度每股收益为 0.08 美元

那么算法应该产生

报告

这是另一个例子。输入是

中国夜猫子散户投资者利用杠杆主导石油期货交易

并且输出例如是

石油期货

1个回答

您可以将问题表述为主题分类任务,因此您需要标记数据。

从无监督的角度来看,您可以用一些固定的特征向量(潜在表示)来表示句子。

  1. 从连续空间生成句子
  2. 第 2 段向量

简介-Dynasil Corporation Of America报告第二季度每股收益为 0.08 美元

中国夜猫子散户投资者利用杠杆主导石油期货交易

自注意力模型对这类问题非常有用,因为您不需要对某个 RNN 模型的最后一个隐藏单元中的所有上下文进行编码来分类标题属于哪个主题。