我正在尝试分析数据集中用户的一种称为“情绪翻转”的行为,但我无法介入。
假设我有两组用户,分别是好用户和坏用户。
我的数据集包含分类为 6 个主题的 N 条推文。这些推文是由坏用户和好用户创建的。
这 6 个主题是关于一般问题的,但其中 3 个主题是关于“坏”用户支持的组织/个人(A),另外 3 个主题是反对(B)他们的意识形态。
坏用户和好用户在他们的推文行为上的区别是:
- 好用户在某些主题(可能是所有主题)中发布推文,而不会在主题中强加“积极”或“消极”情绪。
- 不良用户发布的推文包含对反对她/他的意识形态的主题的负面情绪和对她/他支持的主题的积极情绪。两个用户之间的明显区别还在于,不良用户在 B 主题上大量发表负面情绪,在 A 主题上发表正面情绪。
如何在分数/值中测量/显示这种翻转行为;假设每条推文都由一个向量表示,例如:<# of Pos words, # of Neg words>。
我认为一个好的解决方案会考虑如何密集和在意识形态上清除不良用户行为。
这张图总结了之前的描述:
