假如说:
- 问题出在自然科学领域,即变量之间的关系是基于物理的,不会因上下文而改变
- 它是一个基于回归的模型
与神经网络等相比,假设内核化方法(例如 SVM)对于未知的预测变量组合表现更好,这是否正确?
据我了解,当新输入超出最初训练的分布时,许多 ML 模型通常无法提供准确的预测。例如,基于树的方法,如随机森林,但如果新变量不可用,则在训练的预测器组合上提供出色的输出时会失败。另一方面,内核(尤其是线性)将决策边界投射到初始训练点的空间之外。因此假设,内核投影的阈值/边界有助于为看不见的组合保持更好的准确性。