我有一个 1950-2011 财年大约 40k 公司的数据集,其中大约 430k 公司年。如果我没记错的话,我有面板数据。此外,这些公司嵌套在 9 个行业中。
我为每家公司创建了一个唯一标识符ticn。年份用 表示fyear。现在我感兴趣的变量是年销售额sale、年广告xad和年研发费用xrd。我有由 表示的行业虚拟模型sicagg。我对年销售额和广告/研发支出之间的关系感兴趣,包括一些控制变量。
目前我正处于研究的探索阶段。
所以我的目标是,我想感受一下数据,给出描述,也许还会画一些图。
首先,我在描述性统计(平均值、标准差、最小值和最大值)之间和内部进行了计算。我还绘制了销售、研发和广告之间的散点图。此外,我将每个行业的年平均广告费用的时间序列绘制成一张漂亮的图表。
你能给我一些额外分析的想法吗?提前致谢!