在研究数据挖掘方法时,我了解到有两个主要类别:
预测方法:
- 分类
- 回归
描述方法:
- 聚类
- 关联规则
由于我想根据位置、活动、电池电量(训练模型的输入)来预测用户可用性(输出),我认为很明显我会选择“预测方法”,但现在我似乎无法选择分类和回归。据我了解,分类可以解决我的问题,因为输出是“可用”或“不可用”。
分类能否为我提供用户可用或不可用的概率(或可能性)?
就像在输出中一样,它不仅仅是 0(不可用)或 1(可用),而是类似于:
- 可用的
- 无法使用
这个问题也可以用回归来解决吗?
我知道回归用于连续输出(不仅仅是 0 或 1 个输出),但输出不能是用户可用性的连续值(比如输出是意味着用户是可用,隐含用户是不可用)。