我有一个包含近 5 亿条推文的大数据集。我正在做一些关于公司如何参与激进主义的研究,到目前为止,我已经标记了可以根据推文中某些主题标签的存在而归类为激进主义类别的推文。
现在,让我们假设公司正在发布关于激进主义主题的推文,而没有在推文中插入任何主题标签。我的代码不会对其进行分类,我的想法是运行一个只有一个类的 SVM 分类器。
这导致了以下问题:
- 这个解决方案在数据科学上是否可行?
- 是否存在任何其他一类分类器?
- (最重要的是)是否有任何其他方法可以查找推文是否类似于包含激进主义主题标签的推文的启用?