Elements of Statistical Learning中的表 18.1总结了几个分类器在 14 类数据集上的性能。我正在将一种新算法与套索和弹性网络进行比较,以解决此类多类分类问题。
使用glmnet
版本 1.5.3 (R 2.13.0) 我无法重现表中的第 7 点(惩罚多项式),据报道使用的基因数为 269,测试错误为 13 54. 使用的数据是这个14 癌症微阵列数据集。无论我尝试过什么,我都得到了一个性能最好的模型,它使用了大约 170-180 个基因,测试错误为 54 个中的 16 个。
请注意,在第 18.3 节的开头,第 654 页,描述了数据的一些预处理。
我已经联系了作者——到目前为止没有回应——我问是否有人可以确认在复制表格时存在问题,或者提供关于如何复制表格的解决方案。