我正在研究多标签分类问题,二进制情况。作为目标变量,有五列具有 0-1 值。
对于模型训练,我使用scikit-multilearn library。下面是我使用 Binary Relevance 和 RandomForest 训练模型的代码。
parameters = [
{
'classifier': [RandomForestClassifier(random_state=42)],
'classifier__n_estimators': [50, 100, 200],
'classifier__max_features': ['auto', 'sqrt', 'log2'],
'classifier__max_depth' : [4, 6, 8, 10, 12],
'classifier__criterion' :['gini', 'entropy']}]
clf = RandomizedSearchCV(BinaryRelevance(), parameters, scoring='f1_weighted', cv=5, \
n_jobs=-1, verbose=10, random_state=10)
clf.fit(X_train, y_train)
如何从模型中提取特征重要性?我是否应该从该模型中获取最佳参数,然后使用 sklearn 中的 RandomForest 分别应用于每个标签的数据?