可能,这是一个非常基本的问题,但我似乎无法找到可靠的答案。我希望在这里,我可以。
我目前正在阅读论文,为我自己的硕士论文做准备。目前,我正在阅读一篇研究推文与股市特征之间关系的论文。
在他们的一个假设中,他们提出“增加的推文量与交易量的增加有关”。
我希望它们在成对相关中与 相关tweetVolume
,tradingVolume
但他们使用记录的版本进行报告:LN(tweetVolume)
和LN(tradingVolume)
。
对于我的论文,我复制了他们论文的这一点。我收集了超过 6 个月(tweetVolume
)和同一时间段内的股票交易量的大约 100 家公司的推文。如果我关联绝对变量,我会发现,r=.282, p.000
但是当我使用记录的版本时,我会发现r=.488, p=.000
.
我不明白为什么研究人员有时会使用他们变量的日志版本,以及为什么如果你这样做,相关性似乎会高得多。这里的推理是什么,为什么可以使用记录的变量?
非常感谢您的帮助:-)