如何从我的数据框列中的字符串中提取顶部单词?

数据挖掘 Python 数据挖掘 数据清理
2022-03-01 00:45:05

我的数据框中有一列,它位于提供产品描述的字符串中。例如:这是一件衬衫。它是蓝色的。可用的尺寸有大的,小的。这件衬衫是紧身的。

我想从这个描述中提取关键词,比如衬衫、蓝色、大号、小号、尺寸、紧身等。

我正在使用python。我怎样才能做到这一点?

1个回答

如果单词都很短并且像您提到的那样,我认为您只需删除停用词就可以了。这是对最常见的单词进行简单的文本清理,不会给文本带来额外的含义。让我知道。