有一个数据科学数值问题,我和我的团队能够得到一个预测低至 1% MAPE 误差的 ANN 模型(大约有 70000 多个可训练参数)。
鉴于数据集的性质,这些数据也可以作为图像处理,这导致我尝试使用基于 CNN 的方法来解决同样的问题。到目前为止,我能够通过大约 2000 个参数收敛到 14% 的错误率。假设我能够使用基于 CNN 的架构进一步降低错误(参数没有显着增加)是否合理?
编辑:基本上,我所说的图像是在 ANN 的情况下,数据被处理为一维向量,但在 CNN 的情况下是二维向量。
有一个数据科学数值问题,我和我的团队能够得到一个预测低至 1% MAPE 误差的 ANN 模型(大约有 70000 多个可训练参数)。
鉴于数据集的性质,这些数据也可以作为图像处理,这导致我尝试使用基于 CNN 的方法来解决同样的问题。到目前为止,我能够通过大约 2000 个参数收敛到 14% 的错误率。假设我能够使用基于 CNN 的架构进一步降低错误(参数没有显着增加)是否合理?
编辑:基本上,我所说的图像是在 ANN 的情况下,数据被处理为一维向量,但在 CNN 的情况下是二维向量。
理论上是的,实际上可能。
我这是什么意思。有关于 ANN 的平滑函数的通用逼近定理,也有支持CNN 变体的理论。支持这一说法的另一件事是,您可以使用 CNN 架构复制任何 ANN,从而有效地回溯到原始 ANN。
实践一下,你说这些数据也可以作为图像处理,但它是否具有与其他数据表示相同的信息量?可能但不是必须的,考虑使用时间序列数据的图像进行回归,确保你可以捕捉到一些一般趋势,但要真正捕捉到所有趋势,它会变得非常昂贵,非常快。