我正在使用不平衡的多类数据集。我尝试使用随机搜索和贝叶斯搜索来调整 a和 aDecisionTreeClassifier
的参数。RandomForestClassifier
GradientBoostingClassifier
目前,我只accuracy
用于评分,这并不真正适用于评估我的模型性能(我没有这样做)。是不是也不适合参数调优?
例如,我发现recall_micro
并recall_weighted
产生与accuracy
. 这对于其他指标应该是相同的,例如f1_micro
.
所以我的问题是:评分是否与调优相关?我看到这recall_macro
会导致较低的结果,因为它没有考虑每个类的样本数量。那么我应该使用哪个指标?