我想知道是否有一篇很好的论文介绍了 AI/ML 方法中的模型和数据假设。
例如,如果您查看使用线性模型或 (G)ARCH/ARMA 过程的时间序列建模(估计或预测),则必须满足许多数据假设才能满足基础模型假设:
线性回归
- 您的观察中没有自相关,通常在处理水平数据时(--> ACF)
- 平稳性(单位根 --> 虚假回归)
- 同方差性
- 关于误差项分布“Normaldist”(均值 = 0,以及一些有限方差)等的假设。
自回归模型
- 平稳性
- 平方误差自相关
- ...
在处理 ML/AI 方法时,感觉就像你可以将任何你喜欢的东西作为输入(我的主观感知)。只要某些预测/估计误差测量足够好(类似于高,但通常会误导 R²),您就会对结果感到满意。
用于时间序列预测的 RNN、CNN 或 LSTM 模型必须满足哪些假设?
有什么想法吗?
添加
- 描述我的问题/想法的好文章。
- 讨论模型假设 + 测试的中型文章,但不在更高级模型的背景下
- 我阅读了100 页的 ML Book - 不幸的是,几乎没有关于模型假设或如何测试它们的内容。