是否存在(复杂的)表格数据集,其中深度神经网络(例如超过 3 层)在很大程度上优于 XGBoost 等传统方法?
我更喜欢表格数据集而不是图像数据集,因为大多数图像数据集要么太简单以至于即使 XGBoost 也能很好地执行(例如 MNIST),或者对于 XGBoost 来说太难以至于其性能太低(例如几乎任何更复杂的数据集比 CIFAR10;如果我错了,请纠正我)。
谢谢!
是否存在(复杂的)表格数据集,其中深度神经网络(例如超过 3 层)在很大程度上优于 XGBoost 等传统方法?
我更喜欢表格数据集而不是图像数据集,因为大多数图像数据集要么太简单以至于即使 XGBoost 也能很好地执行(例如 MNIST),或者对于 XGBoost 来说太难以至于其性能太低(例如几乎任何更复杂的数据集比 CIFAR10;如果我错了,请纠正我)。
谢谢!
在我看来,没有。图像也可以解释为表格数据集,其中某些列代表不同的像素 rgb 代码。如果您寻求使用神经网络,请选择具有大样本量的图像数据集。神经网络通常需要大样本量才能执行,并且大尺寸输入不会被 boosting 所超越。