我试图建立一个 CNN 模型。我使用每日温度的时间序列数据来预测是否存在事件风险,比如细菌生长。我计算了时间序列的描述性统计,即。每个观察值的均值、方差、偏度、峰度等,并将它们添加到输入数据中。
我的问题:
CNN 是否能够提取标签的描述性统计效果,这意味着手动添加这些描述性统计特征不会产生影响?(我以后还会尝试这个,但想听听你的想法)。谢谢
我试图建立一个 CNN 模型。我使用每日温度的时间序列数据来预测是否存在事件风险,比如细菌生长。我计算了时间序列的描述性统计,即。每个观察值的均值、方差、偏度、峰度等,并将它们添加到输入数据中。
我的问题:
CNN 是否能够提取标签的描述性统计效果,这意味着手动添加这些描述性统计特征不会产生影响?(我以后还会尝试这个,但想听听你的想法)。谢谢
CNN 学习卷积过滤器,这些过滤器经过训练可以在某种图像/体积数据中寻找局部、重复出现的模式。一维卷积实际上是一回事,但我认为更适合您的情况的是使用Recurrent Neural Nets。它们专为处理异构数据的时间序列而设计。
更新:
我想重新考虑我之前给出的答案。首先,在处理不确定要检测的给定事件持续多长时间的时间序列数据的情况下,我通常会考虑使用循环神经网络 (RNN) 而不是 CNN,因为 RNN 维护所谓的随着时间的推移可以携带潜在有用信息的隐藏状态,即过去的输入可能会影响当前的输出。因此,如果您知道要检测的事件跨越多个时间步长(甚至可能不是连续的时间步长),或者您不确定要检测的事件的时间跨度到底有多长,那么我会建议选择 RNN。如果您决定使用 RNN,向数据中添加额外的统计信息可能会使网络的学习任务更容易,
但是,在某些情况下,使用 CNN 实际上可能就足够了,并且也能产生良好的结果。考虑下图的情况,其中白色瓦片是时间序列输入,而蓝色区域是 CNN 过滤器/内核(或多个)正在处理的区域。
如您所见,有一个时间序列的数据点和从该时间序列派生的一些统计信息已附加到输入数据流中。因此,在图中,增强的时间序列输入包括测量值本身以及从时间序列数据(在连续时间步长上)派生的均值、方差和偏度值。假设您感兴趣的事件类型在时间步长方面受限于您在输入数据上滑动的 CNN 过滤器/内核的宽度,那么一个简单的 CNN 可能就足够了检测您感兴趣的事件。换句话说,如果您的过滤器的宽度至少跨越与感兴趣的事件持续一样多的时间步长,那么您的 CNN 将能够学会检测该事件(经过适当的培训)。在这种情况下,向您的输入数据添加更多统计信息可能确实有助于检测某些事件,甚至是必要的,因为它隐含地扩大了您的 CNN 过滤器在任何给定时间步可以观察到的时间窗口,因为平均值(或其他统计信息)还可以考虑过滤器本身(或多个过滤器......)在您想要检测事件的给定时间步可能不会跨越的过去数据。