数据挖掘 - 混淆矩阵逻辑 - 吾爱随笔录

数据挖掘混淆矩阵

2021-10-06 17:14:03

有人可以解释一下混淆矩阵背后的逻辑吗？

真阳性 (TP)：预测是积极的，实际结果是积极的，结果是“真阳性” - 没有问题。
假阴性（FN）：预测为阴性，实际结果为阳性，结果为“假阴性”——为什么？不应该是“假阳性”吗？
假阳性（FP）：预测是积极的，实际结果是消极的，结果是“假阳性”——为什么？不应该是“真阴性”吗？
True Negative (TN)：预测为 NEGATIVE，实际结果为 NEGATIVE，结果为“True Negative”——为什么？不应该是“假阴性”吗？

4个回答

混淆矩阵是一个经常用来描述分类模型性能的表格。您提供的数字显示了二进制情况，但它也用于 2 个以上的类（只有更多的行/列）。

行指的是输入的实际 Ground-Truth 标签/类，列指的是模型提供的预测。

不同案例的名称取自预测者的观点。

True/False 意味着预测与基本事实相同，Negative/Positive 指的是预测是什么。

混淆矩阵中的 4 种不同情况：

True Positive (TP)：模型的预测是“Positive”，它与实际的 ground-truth 类相同，即“Positive”，所以这是一个 True Positive 案例。

False Negative (FN)：模型的预测是“Negative”并且是错误的，因为实际的 ground-truth 类是“Positive”，所以这是一个 False Negative 案例。

假阳性（FP）：模型的预测是“阳性”的，这是错误的，因为实际的真实类别是“阴性”，所以这是一个假阳性案例。

True Negative (TN)：模型的预测是“Negative”，与实际的 ground-truth 类相同，即“Negative”，所以这是一个 True Negative 案例。

似乎您了解混淆矩阵的含义，但不了解用于命名其条目的逻辑！

这是我的 5 美分：

这些名字都是这样的：

<True/False> <Positive/Negative>
     |                |
   Part1            Part2

第一部分解释预测是否正确。如果您只有True Positive和True Negative ，那么您的模型就是完美的。如果你只有False Positive和False Negative你的模型真的很糟糕。
第二部分解释模型的预测。

所以：

False Negative (FN)：预测为 NEGATIVE (0) 但第一部分为 False，这意味着预测是错误的（应该是 POSITIVE (1)）。
假阳性（FP）：预测是正的（1）但第一部分是假的，这意味着预测是错误的（应该是负的（0））。
True Negative (TN)：预测为 NEGATIVE，第一部分为 True。预测是正确的（模型预测为 NEGATIVE，对于 NEGATIVE 样本）

请找到以下内容：

假阴性（FN）：预测为阴性，实际结果为阳性，结果为“假阴性”——为什么？不应该是“假阳性”吗？
答案：预测模型应该给出“肯定”的答案，但它预测为“否定”，这意味着错误地预测为否定，也就是 False Negative。
假阳性（FP）：预测是积极的，实际结果是消极的，结果是“假阳性”——为什么？不应该是“真阴性”吗？
答案：预测模型应该给出“否定”的答案，但它预测为“肯定”，这意味着被错误地预测为“阳性”，也就是“假阳性”。
真阴性（TN）：预测为阴性，实际结果为阴性，结果为“真阴性”——为什么？不应该是“假阴性”吗？
答案：预测的输出应该是负的，模型也预测为负的。

为了更好地理解，您可以运行一个简单的二元分类模型并分析混淆矩阵。

谢谢你，
KK

True 表示正确，False 表示错误。

True Positive (TP)：模型预测的 P，这是正确的。

假阳性 (FP)：模型预测的 P，这是不正确的，必须预测 N。

True Negative (TN)：模型预测的 N，这是正确的。

False Negative (FN)：模型预测的 N，这是不正确的，一定已经预测了 P。

其它你可能感兴趣的问题