如果除了使用多标签分类器预测标签外,我还对预测每个标签的权重感兴趣,应该采取什么方法?举个例子,假设我试图从他们的情节中预测电影类型,对于像终结者这样的电影,分类器预测 ['Sci-Fi', 'Action'],那么是否也可以估计这些类型的比例那部电影中的类型,比如 70% 的动作和 30% 的科幻?
多标签分类器确实给出了每个类的概率;将这些概率归一化并将它们用作权重是一个好主意吗?
如果除了使用多标签分类器预测标签外,我还对预测每个标签的权重感兴趣,应该采取什么方法?举个例子,假设我试图从他们的情节中预测电影类型,对于像终结者这样的电影,分类器预测 ['Sci-Fi', 'Action'],那么是否也可以估计这些类型的比例那部电影中的类型,比如 70% 的动作和 30% 的科幻?
多标签分类器确实给出了每个类的概率;将这些概率归一化并将它们用作权重是一个好主意吗?
是的,当然,这种技术是存在的。例如,在 XGBoost 中,您可以将目标函数更改为multi:softprob具体的目标函数:
multi:softprob:和softmax一样,但是输出一个ndata * nclass的向量,可以进一步reshape成ndata * nclass矩阵。结果包含属于每个类的每个数据点的预测概率。
根据我的记忆,如果它回答了您的问题,我认为它会四舍五入为 1。