假设我有许多时间序列,例如来自某个地区各个站点的许多温度记录。我想获得整个地区的单一温度记录,我可以用它来描述区域气候的各个方面。直观的方法可能是简单地取每个时间步的所有站点的平均值,但我的统计蜘蛛感(我肯定还没有很好地接触)告诉我这可能并不那么容易。特别是,我认为对整个区域进行平均将消除一些有趣的极端温度,并且我可能会遇到靠近站之间的依赖性的问题。
如果我尝试这样的策略,我可能会面临哪些其他问题,有没有办法克服它们,或者更明智的方法来组合这种数据?
注意:答案可能比我提供的空间示例更笼统。
假设我有许多时间序列,例如来自某个地区各个站点的许多温度记录。我想获得整个地区的单一温度记录,我可以用它来描述区域气候的各个方面。直观的方法可能是简单地取每个时间步的所有站点的平均值,但我的统计蜘蛛感(我肯定还没有很好地接触)告诉我这可能并不那么容易。特别是,我认为对整个区域进行平均将消除一些有趣的极端温度,并且我可能会遇到靠近站之间的依赖性的问题。
如果我尝试这样的策略,我可能会面临哪些其他问题,有没有办法克服它们,或者更明智的方法来组合这种数据?
注意:答案可能比我提供的空间示例更笼统。
首先,我想说我会添加评论,但我还不能这样做(代表),但我喜欢这个问题并想参与,所以这里有一个“答案”。另外,我看到这很旧,但很有趣。
首先,是否可以使用降维技术(如 PCA)来压缩时间序列?如果第一个特征值很大,也许这意味着您对特征向量的使用将代表大部分动态。
其次,更一般地说,您希望使用时间序列做什么?不知道别的,我猜温度可能会变化很大。例如,如果某些温度记录在城市附近,您可能会得到“热岛”类型的效果。或者,横向距离的微小变化恰好会产生垂直距离的巨大变化——一个位置可能在海平面上,就在海洋上,另一个位置不是“太远”,而是海拔一公里。那些肯定会有不同的温度!
这些只是一些想法。也许其他人可以加入并给出更好的答案。