在我的论文中,我svi从谷歌收集了搜索量数据tweets(comp变量tradevol是公司股票的交易量,取自 Yahoo! 金融。 svi并且tweets是我的自变量,tradevol是依赖的。
为了论证起见,假设我为 3 家公司中的每家公司收集了 3 天以上的数据(实际上,我在 200 天内收集了 100 家公司的数据),如下所示:
comp date svi tweets tradevol
-------------------------------------
1 02-12 1.07 223 2,209,425
1 02-13 1.03 200 2,021,502
1 02-14 1.10 196 2,124,555
2 02-12 0.55 110 1,942,211
2 02-13 0.45 211 1,532,453
2 02-14 0.41 104 1,432,655
3 02-12 1.05 303 1,765,273
3 02-13 1.08 250 1,932,672
3 02-14 1.09 277 1,597,892
像这样的数据集随着时间的推移进行测量超出了我学习期间的难度。所以我需要了解如何分析这一点。因此,我在 SPSS / PASW 中分析此数据集时有一些问题。
- 我如何从这个数据集中衡量每家公司之间的相关
svi性tradevol?然后我必须以某种方式告诉 SPSS 拆分数据文件comp,计算每个唯一的相关性comp - 我的论文导师将此数据集称为“面板数据集”。但是,搜索“paneldata analysis SPSS”我找不到太多有用的信息。如果我想执行回归,测量 和 的影响
svi,tweets那么tradevol这怎么调用?多级回归? - 关于回归,我的教练希望我考虑时间滞后。例如, today's
sviandtweets可能对 today's 没有影响,但可能对 today's和明天tradevol有影响(或:更大的影响)。在这种情况下,我必须对滞后 t-2、t-1、t、t+1 和 t+2 执行回归。是否可以使用 SPSS (18) 执行此操作,如果可以,请寄给我一些东西:-)svitweetstradevol