关于多标签概率预测的问题

数据挖掘 机器学习 多类分类 可能性
2022-02-17 05:40:34

我一直在做一个问题,我必须预测多标签(准确地说是四个)分类问题中每个标签的概率。

解决方案示例:

Id, North,          East,            West,           South
1,  0.71663940211,  0.037567315693,  0.03525987339,  0.0021068944991
...

训练数据的形式是每个 y(i) 标记为 0、1、2 或 3(分别编码为 N、E、W 和 S)

如果您能告诉我如何解决这个问题,我将不胜感激。直接洞察问题的链接也足够了。

1个回答

一个问题有点宽泛,因为您没有具体说明您是否不知道如何在理论上做到这一点,或者如何使用 ML 方法来解决它。

一些机器学习方法:

sklearn 中的 LogisticRegression 处理多个

lr = LogisticRegression()
lr.fit(X, y)
class_probabilities = lr.predict_proba(X)  # outputs the probabilities

您可能还想考虑支持向量机。

理论:

当您以所有其他类的样本作为反例训练每个类的单个分类器时,您可以进行“一对一”。(参见维基文章