如何在 SPSS / PASW 中对具有时滞的面板数据进行回归?

机器算法验证 回归 spss 面板数据
2022-03-27 18:11:56

在我的论文中,我svi从谷歌收集了搜索量数据tweetscomp变量tradevol是公司股票的交易量,取自 Yahoo! 金融。 svi并且tweets是我的自变量,tradevol是依赖的。

为了论证起见,假设我为 3 家公司中的每家公司收集了 3 天以上的数据(实际上,我在 200 天内收集了 100 家公司的数据),如下所示:

comp  date   svi  tweets  tradevol
-------------------------------------
1     02-12  1.07  223    2,209,425
1     02-13  1.03  200    2,021,502
1     02-14  1.10  196    2,124,555
2     02-12  0.55  110    1,942,211
2     02-13  0.45  211    1,532,453
2     02-14  0.41  104    1,432,655
3     02-12  1.05  303    1,765,273
3     02-13  1.08  250    1,932,672
3     02-14  1.09  277    1,597,892

像这样的数据集随着时间的推移进行测量超出了我学习期间的难度。所以我需要了解如何分析这一点。因此,我在 SPSS / PASW 中分析此数据集时有一些问题。

  1. 我如何从这个数据集中衡量每家公司之间的相关svitradevol然后我必须以某种方式告诉 SPSS 拆分数据文件comp,计算每个唯一的相关性comp
  2. 我的论文导师将此数据集称为“面板数据集”。但是,搜索“paneldata analysis SPSS”我找不到太多有用的信息。如果我想执行回归,测量 和 的影响svitweets那么tradevol这怎么调用?多级回归?
  3. 关于回归,我的教练希望我考虑时间滞后。例如, today's sviandtweets可能对 today's 没有影响,但可能对 today's明天tradevol有影响(或:更大的影响)在这种情况下,我必须对滞后 t-2、t-1、t、t+1 和 t+2 执行回归。是否可以使用 SPSS (18) 执行此操作,如果可以,请寄给我一些东西:-)svitweetstradevol
2个回答

您可能想应用他们1972 年论文中概述的Fama-MacBeth 回归技术(链接是 PDF,找不到它的常规引用页面。)这是一种粗略的方法,因为它不会做太多的残差聚类或分析,但它很容易实现并且几乎可以肯定已经存在于 SPSS 中。

您将根据您的因素计算某种交易量溢价,而不是风险溢价。您将遇到的最大问题是公司之间的相关性,无论是在交易量方面,还是在诸如新闻价值足以发推文之类的事情上。由于每家公司只有少量的观察结果,我认为如果不预先指定某种依赖于相关性并允许你推断它们的模型,就不可能非常准确地估计相关性。

为了方便你的数据分析,可以试试eviews软件或者stata等。在SPSS中,如果你想运行时滞数据分析,你必须执行数据,比如1到2等。例如:

x : 12, 13,12,17,9,12

您可以创建新变量x1 : 13, 12, 17, 9 and 12第一个数字数据变量x不可用...等等。