假设我有一个神经网络,可以将数据分为 A、B 或 C。我听说一次用一个类的数据训练网络是不好的,例如A,A,A,...,B,B,B,...,C,C,C. 现在,数据中的其他模式是否存在问题?例如A,B,C,A,B,C,A,B,C,...等等。
训练神经网络:数据随机排序重要吗?
数据挖掘
神经网络
深度学习
2021-10-06 17:42:32
1个回答
是的,数据是随机排序的,这一点很重要。您希望删除沿成本函数下降的模式,因为这样的模式会增加过度拟合的可能性。A,A,A, ... B,B,B ...在模式上最容易解释。在这里,网络有机会在进一步移动之前适应第一个训练示例的特性。训练的目标不是适应特殊性,而是找到泛化好的特征。因此,似乎更好的想法是在每次迭代中将网络暴露给不同的示例。
我见过的大多数研究工作只是简单地将每个时期的示例顺序随机化。但认为实际上可能存在有用的模式似乎是明智的。也许一个专注于最大化网络在每次后续迭代中暴露的各种特征。
其它你可能感兴趣的问题