从“统计学习要素”复制表 18.1

机器算法验证 分类 套索 网络
2022-03-12 11:09:17

Elements of Statistical Learning中的表 18.1总结了几个分类器在 14 类数据集上的性能。我正在将一种新算法与套索和弹性网络进行比较,以解决此类多类分类问题。

使用glmnet版本 1.5.3 (R 2.13.0) 我无法重现表中的第 7 点(惩罚多项式),据报道使用的基因数为 269,测试错误为 13 54. 使用的数据是这个14 癌症微阵列数据集无论我尝试过什么,我都得到了一个性能最好的模型,它使用了大约 170-180 个基因,测试错误为 54 个中的 16 个。L1

请注意,在第 18.3 节的开头,第 654 页,描述了数据的一些预处理。

我已经联系了作者——到目前为止没有回应——我问是否有人可以确认在复制表格时存在问题,或者提供关于如何复制表格的解决方案。

1个回答

你检查过这本书的R包吗? 它包含所有数据集、函数和其中使用的大部分脚本......