我试图在执行主题建模之前删除停用词。我注意到一些否定词(not,nor,never,none 等)通常被认为是停用词。例如,NLTK、spacy 和 sklearn 在它们的停用词列表中包含“not”。但是,如果我们从下面的这些句子中删除“不”,它们就会失去重要的意义,这对于主题建模或情感分析来说是不准确的。
1). StackOverflow is helpful => StackOverflow helpful
2). StackOverflow is not helpful => StackOverflow helpful
谁能解释为什么这些否定词通常被认为是停用词?