定义情绪的范围

数据挖掘 情绪分析 加权数据 描述性统计
2021-09-20 12:09:33

我们正在捕捉情绪作为调查回复。出于分析目的,我们需要为响应(情绪)分配值。是否有可以分配的最佳范围来实现这一目标?(例如从 -100 到 100)。一个问题和一组答案的示例如下。

问题:“你今天感觉如何?”

答案:糟糕、悲伤、好、好、好

我们可以想到的一种合适的方法是以相等的距离分配从 1 到 100 的值。这在统计上有效吗?在实现这一目标时,我们应该考虑哪些事情?在这种情况下,只分配正整数,因为我们需要计算加权平均值等统计数据。我们不能也分配负数吗?

1个回答

最终的情绪范围是完全任意的。无论区间 [a, b],您都可以调整情绪以适应内部。[-100, 100] 完全合理并且很常见。一个使用示例来自 GDELT,它为新闻文档的平均色调提供了这个间隔。

询问同样疏远的情绪在统计上是否正确是没有意义的。这完全取决于您的用例和意见。此外,绝对没有理由不能在加权平均值中使用负数。

如果你提到了你在做什么以及你是如何评估情绪的,那么可能还有更多话要说。