深度学习:参数选择和结果解释

数据挖掘 机器学习 深度学习
2022-02-22 04:20:55

我在 MLP 中实现了一个多类(7 个标签)分类问题。我正在尝试根据一些数据对 7 种癌症进行分类。整体准确率相当低,约为 58%。然而,对于不同的参数,一些癌症的分类准确率约为 90%。癌症下面的 1、2、3 等表示不同类型的癌症,例如 1 = 乳腺癌,2 = 肺癌等。现在,对于不同的参数设置,我得到不同的分类精度。例如,

1. 超参数

    learning_rate = 0.001
    training_epochs = 10
    batch_size = 100
    hidden_size = 256
    #overall accuracy 53%, cancer 2 accuracy 91%, cancer 5 accuracy 88%, 
     #cancer 6 accuracy 89% 

2.超参数

    learning_rate = 0.01
    training_epochs = 30
    batch_size = 100
    hidden_size = 128
    #overall accuracy 56%, cancer 2 accuracy 86%, cancer 5 accuracy 93%, 
    #caner 6 accuracy 75%

如您所见,对于不同的参数设置,我得到完全不同的结果。癌症 1、3、4、7 的准确率非常低,因此我将它们排除在外。但癌症2、5,6的效果相对较好。但是,对于癌症 6,结果因参数设置而异。

一个重要的注意事项是,这里的整体准确性并不重要,但如果我能以超过 90% 的准确率对 2-3 种癌症进行分类,那就更重要了。所以我的问题是,我如何解释结果?在我的论文中我应该如何显示结果?我应该显示/使用哪些参数设置?或者我应该为不同的癌症类型显示不同的参数设置?那么基本上,如何处理这种情况呢?

1个回答

你正在训练很少的时期。高方差可能是由于训练时间不够长造成的。

至于按类别显示超参数对性能的影响,可以使用表格。行可以是类,列可以是超参数值,单元格值可以是评估指标。