看了维基百科,又看了一圈,还是不清楚自己在做的多标签分类问题中如何识别真阳性、真阴性、假阳性和假阴性,以便计算精度,召回和F-measure。
我有几个类别和几百个文档。训练了SVM进行分类后,我有以下数据
document 1 | actual category, category assigned by SVM
document 2 | actual category, category assigned by SVM
...
document n | actual category, category assigned by SVM
SVM 分配的类别通常与实际类别相同,但并非总是如此。真正的积极因素是
actual category = category assigned by SVM
我想误报会是
actual category =/= category assigned by SVM
但我不确定是假阳性还是真阴性。
我觉得这可能是一个基本问题,但我找不到一个清晰(足够)的例子。