2016 年 6 月更新:
请参阅 Ben 的博客条目,描述他目前对完成此任务的想法lme4
:Braindump 2016 年 6 月 1 日
如果您更喜欢贝叶斯方法,该brms
软件包brm
支持一些相关结构:CRAN brms page。(特别注意:“从 brms 版本 0.6.0 开始,AR 结构是指残差的自回归效应,以匹配 nlme 等其他包中的命名和实现。以前,brms 中的 AR 术语指的是响应的自回归效应。后者现在被命名为 ARR 效果,可以使用 cor_arma 和 cor_arr 函数中的参数 r 进行建模。")
2013 年 7 月的原始答案:
(从评论转换。)
我会说lmer
年份的随机效应和客户的随机效应会很好(假设您每年每个客户只有一次测量);
lmer(y~1 + (1|year) + (1|customer), ...)
适合(仅拦截)模型
Yij∼Normal(a+ϵyear,i+ϵcustomer,j,σ20)
其中和是具有自己特定方差的零均值正态变量。ϵyearϵcustomer
这是一个非常无聊的模型,您可能想要添加一个整体(固定效应)时间趋势,并考虑一个随机的客户交互时间(即随机斜率)。我认为
lmer(y~year + (1|year) + (year|customer), ...)
应该适合模型
Yij∼Normal((a+ϵcustomer,j)+(b+ϵyear×customer,j)⋅year+ϵyear,i,σ20)
(year
以这种方式使用是在同一模型中不包括输入变量作为拟合效应和随机效应的常规规则的一个例外;如果它是一个数字变量,则在固定效应和(随机)year
中被视为连续year:customer
交互作用和随机效应中的分类...)
当然,您可能想要添加年份级别、客户级别和观察级别的协变量,这些协变量会吸收一些相关的方差(例如,添加平均消费者价格指数来解释为什么年份不好或好......)
理想情况下,您还希望在每个客户的时间序列中允许时间自相关,这目前是不可能的lmer
,但您可以检查时间自相关函数,看看这是否重要......
警告:我对处理面板数据的标准方法知之甚少;这仅基于我对混合模型的了解。如果这似乎违反了计量经济学中的标准/最佳实践,评论者(或编辑)应该随时提出意见。