高度不规则的时间序列

机器算法验证 时间序列 多层次分析 不均匀间隔时间序列
2022-03-04 14:24:32

我有一些不同鱼类种群的数据,采样时间约为 5 年,但模式非常不规则。有时样品之间有几个月,有时一个月有几个样品。还有很多 0 计数

如何处理这样的数据?

我可以很容易地在 R 中绘制它,但是这些图表并不是特别有启发性,因为它们非常颠簸。

在建模方面 - 将物种建模为各种事物的函数 - 可能是混合模型(又名多级模型)。

欢迎任何参考或想法

回应评论的一些细节

大约有15种。

我试图了解每条鱼的任何趋势或季节性,并查看这些物种之间的关系(我的客户最初想要一个简单的相关表)

目标是描述性和分析性的,而不是预测性的

进一步编辑:我确实找到了 K. Rehfield 等人的这篇论文,其中建议使用高斯核来估计高度不规则时间序列的 ACF

http://www.nonlin-processes-geophys.net/18/389/2011/npg-18-389-2011.pdf

2个回答

我花了很多时间为不均匀间隔的时间序列构建一个通用框架:http: //www.eckner.com/research.html

另外,我写了一篇关于不均匀时间序列的趋势和季节性估计的论文。

我希望你会发现结果有帮助!

我不知道混合模型是否非常合适(使用标准包,其中随机效应结构是线性预测器),除非您认为所有时间点的数据在某种意义上应该可以相互交换(在这种情况下不规则间隔不是问题) - 它不会真正以合理的方式对时间自相关进行建模。有可能你可以欺骗 lmer() 做一些自私的事情,但你现在到底是怎么做的,我现在不知道(我可能没有想清楚)。另外,我不确定在混合模型场景中引起自相关的“分组变量”是什么。

如果时间自相关是一个令人讨厌的参数并且您不希望它大,那么您可以将数据分成在相关性方面彼此基本不相交的时期(例如,在没有数据的月份将时间序列分开)并将它们视为独立的复制品。然后,您可以在此修改后的数据集上执行类似 GEE 的操作,其中“集群”由您所在的时代定义,工作相关矩阵的条目是观测值相距多远的函数。如果你的回归函数是正确的,那么即使相关结构被错误指定,你仍然会得到回归系数的一致估计。这也将允许您将其建模为计数数据,例如,使用对数链接(就像泊松回归中通常那样)。您还可以在物种之间建立一些差异相关性,其中每个时间点被视为物种计数的多元向量,时间点之间存在一些时间衰减的关联。这将需要一些预处理来欺骗标准 GEE 包执行此操作。

如果时间自相关不是令人讨厌的参数,我会尝试更像结构化协方差模型的东西,在该模型中,您将整个数据集视为对大多元向量的一个观察,这样观察之间的协方差Ys,Yt关于物种u,v

cov(Ys,Yt)=fθ(s,t,u,v)

在哪里f是某个参数函数,已知参数数量有限,θ,以及一些控制平均结构的参数。您可能需要为这样的模型“构建自己的”,但如果有 MPLUS 包可以为计数数据执行此类操作,我也不会感到惊讶。