改进建议?学术心理学中情绪相关词的相对频率随时间变化的时间序列

数据挖掘 时间序列 数据 解释 语料库
2022-02-28 14:11:49

第一次绘制和解释时间序列数据,为了便于使用,我使用了线图。我知道这是非常基本的,但任何输入/建议将不胜感激(例如,有什么不清楚的地方吗?)。

  • 我主要关心的是我是否充分展示了数据以及
    我是否可以做任何有用的改进(例如,移动平均线)?
  • 此外,我是否适当地解释了这个时间序列数据:

“情感相关标记的相对频率(心理学摘要中每 10,000 个标记的计数)从 1980 年的 3.51% 增加到 2017 年的 4.87%——总体相对增加了 39%。情感相关标记的相对频率显示增加以每年大约 0.037 个单位的速度(超过 37 年)。总体而言,这表明随着时间的推移,学者在心理学摘要中使用与情感相关的术语的快速增长趋势。

随着时间的推移,心理学中情绪相关词的相对频率

1个回答

我知道这是非常基本的,但任何输入/建议将不胜感激(例如,有什么不清楚的地方吗?)。

一般来说,强烈建议以最简单的方式交流知识,只要它是准确的。是的,线图很简单,但这并没有错,在这种情况下,我想不出更好的方法来准确地传达观察结果。

我主要关心的是我是否充分展示了数据以及我是否可以做任何有用的改进(例如,移动平均线)?

它完美地显示了增长趋势,这是您的主要观点:

  • 在这种情况下,移动平均线并没有真正的帮助:只有当数据中存在太多噪声/变化并且难以看到总体趋势时,它才有用。在这里你显然有足够的数据和/或数据足够稳定,所以根本不需要。
  • 您负责将绘制的值设为每 10,000 个标记的比例,这也是一个好主意,因为绝对值的增加可能会产生偏差:如果摘要的总数增加,包含目标术语的摘要的比例自然会增加以及即使这没有显示任何东西。

总的来说,这对我来说非常好。只是一个小提示,在您的描述中,您可以提到按年计算的比率是平均值:“平均每年大约 0.037 个单位