results$RMSE在插入符号中,和的计算results$Rsquared并不像您所说的那么简单。它们实际上是RMSE和R2超过十个坚持集。
要确认这一点,请运行摘要:
> t1
glmnet
1000 samples
20 predictors
No pre-processing
Resampling: Cross-Validated (10 fold)
Summary of sample sizes: 900, 900, 900, 900, 900, 900, ...
Resampling results across tuning parameters:
alpha lambda RMSE Rsquared
0.10 0.01065054 17.93931 0.1655746
0.10 0.10650539 17.93720 0.1656599
0.10 1.06505391 17.89291 0.1678166
0.55 0.01065054 17.93838 0.1657046
0.55 0.10650539 17.91755 0.1668356
0.55 1.06505391 17.84962 0.1731936
1.00 0.01065054 17.93824 0.1657245
1.00 0.10650539 17.90045 0.1678998
1.00 1.06505391 17.92535 0.1710923
RMSE was used to select the optimal model using the smallest value.
The final values used for the model were alpha = 0.55 and lambda = 1.065054.
对于最佳参数组合alpha = 0.55 and lambda = 1.065054,每个保留集的性能都可以在对象中看到t1$resample:
> t1$resample
RMSE Rsquared Resample
1 18.42848 0.04479504 Fold05
2 21.17820 0.10500276 Fold08
3 18.27933 0.20858027 Fold04
4 17.31308 0.19080079 Fold07
5 16.60865 0.21812706 Fold10
6 20.07291 0.18737052 Fold02
7 16.48082 0.24041654 Fold03
8 17.18363 0.18379930 Fold06
9 17.29819 0.13669866 Fold09
10 15.65289 0.21634546 Fold01
(不用说,上面看到的 RMSE 和 Rsquared 是在不同的 CV 折叠上评估的,因此它们的排名顺序不同。)如果对这些列进行平均,您将得到:
> mean(t1$resample$RMSE)
[1] 17.84962
> mean(t1$resample$Rsquared)
[1] 0.1731936
...这与摘要第 6 行中看到的 RMSE 和 Rsquared 数字相同。
编辑:为什么平均折叠会破坏排名顺序?假设我们将数据拆分为F折叠,我们正在考虑C调音组合。对于每个组合c并保持折叠f, 之间的关系R2和 MSE 按折叠计算f是:
Rsquared(c,f)=1−MSE(c,f)Var(f),(1)
在哪里Var(f)是折叠中观察到的响应的方差的简写f. 当然,对于给定的f, 如果我们平均c那么之间的单调关系R2并且 MSE 被保留,因为线性:
1C∑cRsquared(c,f)=1−1C∑cMSE(c,f)Var(f).(2)
但是,如果我们平均 (1)f我们不能断言类似的陈述,因为分母Var(f),随着折叠的展开而变化,阻碍了:
1F∑fRsquared(c,f)=1−1F∑f(MSE(c,f)Var(f)).(3)
(3) 的 RHS 不能进一步简化以揭示平均值之间的单调关系R2所有折叠和所有折叠的平均 MSE。
由于 MSE 是 RMSE 的平方,所以折叠平均之间的关系R2而折叠平均 RMSE 则更不直接。实际上,对于任何给定的折叠,组合平均之间甚至没有 (2) 的类似物R2和组合平均 RMSE。