可能这是一个非常基本的问题,但我似乎无法找到一个可靠的答案。我希望在这里,我可以。
我目前正在阅读论文,以准备自己的硕士学位论文。目前,我正在阅读一篇研究推文与股市特征之间关系的论文。
在他们的假设之一中,他们提出“增加的推文交易量与交易量的增加有关”。
我希望它们以成对相关性tweetVolume
与关联tradingVolume
,但是相反,它们使用记录的版本进行报告:LN(tweetVolume)
和LN(tradingVolume)
。
对于我的论文,我复制了他们的论文的这一部分。我收集了大约100个公司的6个月以上的推文(tweetVolume
)和同一时间段的股票交易量。如果我将绝对变量相关联,r=.282, p.000
则会发现,但是当我使用记录的版本时,会发现r=.488, p=.000
。
我不明白为什么研究人员有时会使用变量的记录版本,以及为什么相关性似乎要高得多。这是什么原因,为什么可以使用记录的变量?
非常感谢您的帮助:-)