为什么多重共线性对机器学习模型如此不利?
有没有时候我们可以忽略多重共线性?
正则化(,)如何帮助我们处理多重共线性?
为什么多重共线性对机器学习模型如此不利?
有没有时候我们可以忽略多重共线性?
正则化(,)如何帮助我们处理多重共线性?
最容易理解的方法是想象你有两个相同的特征,例如摄氏温度和华氏温度。这是一个完美共线性的例子。
会发生两件事,都是不好的。一是至少你会浪费一些神经元。在第一层中,您有输入,用于特征。其中两个特征本质上是相同的,但模型不知道它并为它们分配权重:,其中神经元在第一层。所以,你一开始就浪费了神经元。
第二件事是这会退化潜在的最优解。再次,考虑第一层的连接,如果第一个和第二个输入是共线的,那么有无限数量的组合将产生与该 sumproduct 相同的精确结果。这将使您的优化器感到困惑,并使其工作更加困难。