所有者搜索给定的服务器 SNO

人工智能 机器学习 自然语言处理 Python
2021-11-12 11:12:13

我是 NLP 的新手。我有一个包含以下列的 excel 表:Server_SNo、所有者、托管部门、总线所有者、托管的应用程序、功能、评论

一个。除了 Server_SNo,其他列可能有数据,也可能没有数据。
湾。对于某些记录,除了第一列 Server_SNo 之外没有其他数据。C。一位企业主可以拥有多于 1 台服务器。

因此,在 4000 条记录中,大约 50% 的数据包含具有所有者的服务器的直接映射。剩余 50% 的数据包含其他列的组合(所有者、托管部门、总线所有者、托管的应用程序、功能和评论)

这是我的问题,我需要为给定的 Server_Sno 找到 50% 的数据的所有者,这些数据具有其他列的组合(所有者、托管部门、总线所有者、托管的应用程序、功能和评论)。

我刚刚开始使用 Python 和 NLTK 构建代码。

这是一个 NLP 问题吗?我在使用 Python 和 NLTK 进行 NLP 的方向正确吗?

任何见解都值得赞赏。

-玛尼

1个回答

我不认为这归类为 NLP 问题,几乎不需要语义分析,它更像是使用分类特征的分类问题。

如果您想在编码变量之前执行一些文本“清理”或预处理,NLTK 肯定是有价值的。我认为您可以在这里应用的唯一 NLP 应用程序是对评论进行一些情绪分析以提取额外特征(例如表示每个评论的消极或积极的数字)。不过,您可能希望使用一些预训练模型来做到这一点,因为您的数据集非常小。