混淆矩阵逻辑
混淆矩阵是一个经常用来描述分类模型性能的表格。您提供的数字显示了二进制情况,但它也用于 2 个以上的类(只有更多的行/列)。
行指的是输入的实际 Ground-Truth 标签/类,列指的是模型提供的预测。
不同案例的名称取自预测者的观点。
True/False 意味着预测与基本事实相同,Negative/Positive 指的是预测是什么。
混淆矩阵中的 4 种不同情况:
True Positive (TP):模型的预测是“Positive”,它与实际的 ground-truth 类相同,即“Positive”,所以这是一个 True Positive 案例。
False Negative (FN):模型的预测是“Negative”并且是错误的,因为实际的 ground-truth 类是“Positive”,所以这是一个 False Negative 案例。
假阳性(FP):模型的预测是“阳性”的,这是错误的,因为实际的真实类别是“阴性”,所以这是一个假阳性案例。
True Negative (TN):模型的预测是“Negative”,与实际的 ground-truth 类相同,即“Negative”,所以这是一个 True Negative 案例。
似乎您了解混淆矩阵的含义,但不了解用于命名其条目的逻辑!
这是我的 5 美分:
这些名字都是这样的:
<True/False> <Positive/Negative>
| |
Part1 Part2
第一部分解释预测是否正确。如果您只有True Positive和True Negative ,那么您的模型就是完美的。如果你只有False Positive和False Negative你的模型真的很糟糕。
第二部分解释模型的预测。
所以:
False Negative (FN):预测为 NEGATIVE (0) 但第一部分为 False,这意味着预测是错误的(应该是 POSITIVE (1))。
假阳性(FP):预测是正的(1)但第一部分是假的,这意味着预测是错误的(应该是负的(0))。
True Negative (TN):预测为 NEGATIVE,第一部分为 True。预测是正确的(模型预测为 NEGATIVE,对于 NEGATIVE 样本)
请找到以下内容:
假阴性(FN):预测为阴性,实际结果为阳性,结果为“假阴性”——为什么?不应该是“假阳性”吗?
答案:预测模型应该给出“肯定”的答案,但它预测为“否定”,这意味着错误地预测为否定,也就是 False Negative。假阳性(FP):预测是积极的,实际结果是消极的,结果是“假阳性”——为什么?不应该是“真阴性”吗?
答案:预测模型应该给出“否定”的答案,但它预测为“肯定”,这意味着被错误地预测为“阳性”,也就是“假阳性”。真阴性(TN):预测为阴性,实际结果为阴性,结果为“真阴性”——为什么?不应该是“假阴性”吗?
答案:预测的输出应该是负的,模型也预测为负的。
为了更好地理解,您可以运行一个简单的二元分类模型并分析混淆矩阵。
谢谢你,
KK
True 表示正确,False 表示错误。
True Positive (TP):模型预测的 P,这是正确的。
假阳性 (FP):模型预测的 P,这是不正确的,必须预测 N。
True Negative (TN):模型预测的 N,这是正确的。
False Negative (FN):模型预测的 N,这是不正确的,一定已经预测了 P。
