我正在对不同的时间序列执行 PCA,然后使用 K 均值聚类来尝试将共同因素组合在一起。
我面临的问题是一些因素进出时间序列。例如,我总共可能有 12 年的数据点,有些因素可能在整个 12 年中都存在,但有些因素可能会逐渐消失(例如,前两年活跃,三年不活跃,其余时间活跃)。
我可以使用迭代 PCA 来填补数据中的一些常见空白,但我不确定用什么来处理大块(数年)的数据空白。例如,如果一个因素只存在于最后三年,我是否应该将其纳入分析?
我正在对不同的时间序列执行 PCA,然后使用 K 均值聚类来尝试将共同因素组合在一起。
我面临的问题是一些因素进出时间序列。例如,我总共可能有 12 年的数据点,有些因素可能在整个 12 年中都存在,但有些因素可能会逐渐消失(例如,前两年活跃,三年不活跃,其余时间活跃)。
我可以使用迭代 PCA 来填补数据中的一些常见空白,但我不确定用什么来处理大块(数年)的数据空白。例如,如果一个因素只存在于最后三年,我是否应该将其纳入分析?
主成分分析 (PCA) 不适用于时间序列数据。最好切换到为时间序列设计的奇异频谱分析 (SSA) 。
对于缺失数据,有一些填补空白的 SSA 版本。