数据挖掘 - 添加额外输入数据后生产的准确性下降 - 吾爱随笔录

我正在尝试使用 CNN 来预测 TimeSeriesA。我创建时间序列的快照图像，然后标记这些图像。

通过一个非常简单的快照，我得到了合理的训练和测试准确性。当我将模型应用于生产中的现实世界时，我也获得了合理的准确性。

为了提高准确性，我在快照中添加了其他时间序列，这些时间序列可能会或可能不会增加价值。

我的训练和测试准确性都提高了（训练更多）。但是，我的生产精度大大下降了。

为什么会发生这种情况？原始数据仍以完全相同的格式保存在快照中。CNN 会被附加数据混淆（错误的词！）吗？

下面看一下 TimeSeriesA 的平稳性：

Year: 2000 Ave: -0.0003 Std: 0.0076 Skew: 0.2166
Year: 2001 Ave: -0.0002 Std: 0.0072 Skew: 0.0158
Year: 2002 Ave: 0.0006 Std: 0.0056 Skew: -0.2445
Year: 2003 Ave: 0.0007 Std: 0.0065 Skew: -0.0402
Year: 2004 Ave: 0.0003 Std: 0.0067 Skew: -0.2640
Year: 2005 Ave: -0.0005 Std: 0.0056 Skew: 0.2420
Year: 2006 Ave: 0.0004 Std: 0.0047 Skew: 0.2711
Year: 2007 Ave: 0.0004 Std: 0.0039 Skew: -0.3177
Year: 2008 Ave: -0.0001 Std: 0.0087 Skew: 0.3768
Year: 2009 Ave: 0.0001 Std: 0.0076 Skew: 0.2327
Year: 2010 Ave: -0.0002 Std: 0.0074 Skew: 0.0112
Year: 2011 Ave: -0.0001 Std: 0.0074 Skew: -0.2599
Year: 2012 Ave: 0.0001 Std: 0.0051 Skew: 0.2541
Year: 2013 Ave: 0.0002 Std: 0.0046 Skew: 0.0818
Year: 2014 Ave: -0.0005 Std: 0.0039 Skew: -0.1489
Year: 2015 Ave: -0.0004 Std: 0.0076 Skew: 0.2973
Year: 2016 Ave: -0.0001 Std: 0.0051 Skew: 0.0076
Year: 2017 Ave: 0.0005 Std: 0.0045 Skew: 0.3101
Year: 2018 Ave: -0.0002 Std: 0.0045 Skew: -0.1658
Year: 2019 Ave: -0.0002 Std: 0.0033 Skew: -0.1124

我使用截至 2010 年底的数据训练模型。我的训练准确度和验证准确度约为 65%。

然后，当我将模型应用于 2011 年至 2019 年的数据时，我的准确度下降了。绿色年份是那些包含在培训中的年份。