在回归任务上训练神经网络的情况下。假设数据有大量异常值。前提是误差需要是 RMS 而不是 MAE。将权重更新中的平均批量大小替换为批量大小计算的中值是否会更好(因为对异常值不那么敏感)?
对于足够大的批量大小,这应该会减少异常值的影响。不过,至少就目前的知识而言,这似乎并不常见。这种方法的缺点是什么?
在回归任务上训练神经网络的情况下。假设数据有大量异常值。前提是误差需要是 RMS 而不是 MAE。将权重更新中的平均批量大小替换为批量大小计算的中值是否会更好(因为对异常值不那么敏感)?
对于足够大的批量大小,这应该会减少异常值的影响。不过,至少就目前的知识而言,这似乎并不常见。这种方法的缺点是什么?
一个缺点是中位数的计算成本通常高于平均值。可以使用快速选择的变化来计算中值,这是线性的最坏情况性能。计算平均值只需要数字的总和和计数。