机器算法验证 - 多类分类系统中的精度和召回率？ - 吾爱随笔录

看了维基百科，又看了一圈，还是不清楚自己在做的多标签分类问题中如何识别真阳性、真阴性、假阳性和假阴性，以便计算精度，召回和F-measure。

我有几个类别和几百个文档。训练了SVM进行分类后，我有以下数据

document 1 | actual category, category assigned by SVM
document 2 | actual category, category assigned by SVM
...
document n | actual category, category assigned by SVM

SVM 分配的类别通常与实际类别相同，但并非总是如此。真正的积极因素是

actual category = category assigned by SVM

我想误报会是

actual category =/= category assigned by SVM

但我不确定是假阳性还是真阴性。

我觉得这可能是一个基本问题，但我找不到一个清晰（足够）的例子。