数据挖掘 - 如何将混淆矩阵的准确性提高到 100%？ - 吾爱随笔录

如何将混淆矩阵的准确性提高到 100%？

数据挖掘机器学习 Python

2022-02-23 21:06:55

是否有可能达到上述要求？有人可以与我分享如何去做吗？

2个回答

贝叶斯错误

要回答您的问题，首先我应该解释贝叶斯错误。 ) 和每个类 ( ) 的精确联合分布，我们构建一个分类器，将标签分配给每个特征向量由这个标准通过计算预期分类误差可以证明这是最好的分类器在整个特征空间上。这种预期的分类误差称为贝叶斯误差，是该特征标签空间可实现的最小分类误差。 $\mathbf{x}$ ${C_k}$ $P(\mathbf{x},{C_k})$ $k$

\underset{k}{\arg max} P (C_{k} | x)

$\mathop {\arg \max }\limits_k P(\left. {{C_k}} \right|\mathbf{x})$

训练错误

如果您在训练数据上评估您的模型并使用训练样本计算混淆矩阵，您可能会达到 100% 的准确度，因为您的模型可能会过度拟合您的训练数据。这意味着您的训练错误为 0，即使贝叶斯错误可能不是。

泛化错误

如果您在测试数据上评估模型并使用测试样本计算混淆矩阵，则无法达到 100% 的准确度，因为您正在评估模型的泛化能力，并且其误差不能小于贝叶斯误差。

达到这样的精度很难但并非不可能，尤其是当您在现实生活中测试模型以查看模型是否可以达到相同的精度时。以下是一些有助于提高模型准确性的提示：

1- 更改用于训练模型的算法，例如，如果您使用传统的机器学习算法（如 SVM），请尝试使用深度学习算法之一，如 CNN。

2- 获取更多数据，改变数据质量，对数据进行扩充，对数据进行一些预处理，或者尝试其他预处理技术（如果您已经这样做了）。

有关更多信息，请参见此处、此处或此处。

其它你可能感兴趣的问题

上一篇神经网络精度：测试集与真实世界数据下一篇为什么逻辑回归比 svm 表现更好？