嘿伙计们,我发现了一两篇使用岭回归的论文(用于篮球数据)。如果我运行岭回归,我总是被告知要标准化我的变量,但我只是被告知要这样做,因为岭是尺度变量(岭回归并不是我们课程的真正一部分,所以我们的讲师略读了一下)。
我阅读的这些论文没有标准化它们的变量,这让我感到有些惊讶。他们还通过交叉验证得到了较大的 lambda 值(大约 2000-4000 水平),我被告知这是由于没有标准化变量。
不标准化的变量究竟是如何导致高 lambda 值的,以及一般不标准化变量的后果是什么?真的有这么大吗?
任何帮助深表感谢。