我正在进行一项纵向研究,并试图在定义的事件发生之前找出模式。例如,我们有数据:
ID Date Amount Feature Event_ind
1 2010 5 M 0
1 2011 4 M 0
1 2012 3 M 1
目标是在给定历史数据的情况下“预测”事件发生的时间。目前,我们正在探索是否可以将这个长表转换为宽表。该表如下所示:
ID Date1 Amount1 Date2 Amount2 Feature
1 2010 5 2011 4 M
我的问题是,这种转换的含义是什么?(或任何解释这一点的好博客/学术论文)
我能想到的其中一个含义是,在一张宽大的表格中,每个重复测量都有自己的分布;如果它是在不同的时间或以不同的频率测量的,那么这种转换就没有意义了。