跨多个主题测量触发器行为

数据挖掘 数据挖掘 情绪分析 社会网络分析
2022-02-25 23:54:24

我正在尝试分析数据集中用户的一种称为“情绪翻转”的行为,但我无法介入。

假设我有两组用户,分别是好用户和坏用户。

我的数据集包含分类为 6 个主题的 N 条推文。这些推文是由坏用户和好用户创建的。

这 6 个主题是关于一般问题的,但其中 3 个主题是关于“坏”用户支持的组织/个人(A),另外 3 个主题是反对(B)他们的意识形态。

坏用户和好用户在他们的推文行为上的区别是:

  • 好用户在某些主题(可能是所有主题)中发布推文,而不会在主题中强加“积极”或“消极”情绪。
  • 不良用户发布的推文包含对反对她/他的意识形态的主题的负面情绪和对她/他支持的主题的积极情绪。两个用户之间的明显区别还在于,不良用户在 B 主题上大量发表负面情绪在 A 主题上发表正面情绪。

如何在分数/值中测量/显示这种翻转行为;假设每条推文都由一个向量表示,例如:<# of Pos words, # of Neg words>。

我认为一个好的解决方案会考虑如何密集和在意识形态上清除不良用户行为。

这张图总结了之前的描述:

在此处输入图像描述

1个回答

所以我对此有一个理论。我们希望能够区分情绪化和有偏见的用户与不情绪化和公正的用户。

M=emotionalityB=Biasti=tweet number ibi=bad words in tipi=good words in tiwi=words in tiM=(bi+pi)wiB=(bipi)2wi

M 是情感性,因为它计算了该词成为情感词(而不是描述性词)的频率。

B 是偏见,因为有偏见的推文会比两边平等的推文有更多的好(或坏)词。

我不知道这个预测是否成立,但我认为如果你将每条推文 x 绘制为偏见,将 y 绘制为带有好坏色调的情绪,将会有两个集群(我渴望被证明是错误的这听起来确实是一个有趣的问题)!