数据挖掘 - 试图用python为分类结果制作引人注目的图 - 吾爱随笔录

试图用python为分类结果制作引人注目的图

数据挖掘 Python 分类可视化

2021-09-19 08:37:45

我一直在研究分类问题并取得了一些不错的结果，但现在我努力拼凑出一个好的图来说明每个预测的概率。这是我目前的数据：

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

df_voting_output.head(n=5)
    prob    actual  pred    correct
0   0.460200    0   0   1
1   0.548478    1   1   1
2   0.270609    0   0   1
3   0.686557    0   1   0
4   0.527935    0   1   0
5   0.098687    0   0   1

我已经能够使用以下代码创建带有概率的条形图：

plt.bar(np.arange(len(voting_predictions[:,1])), voting_predictions[:,1])
plt.xlabel("record number")
plt.ylabel("probability")
plt.title("Classification Probabilities")
plt.show()

但是，我认为必须有更好的方法来包含更多信息和密钥。我希望清楚地看到“正确”标签，因此从视觉的角度来看，您可以看到概率与正确分类的关系。

2个回答

你想通过呈现这个情节来传达什么信息？这决定了合适的绘图类型。

如果概率的特定索引很重要，您在问题中显示的条形图将很有用 - 例如，如果索引 504-559 可能有一些特别之处，并且有人想查看这些索引的概率 -但我怀疑情况并非如此。您更有可能对概率如何与实际结果相关联感兴趣。为了证明这一点，您可以从一个简单的散点图开始，横轴为概率，纵轴为实际结果。如果您对 0 和 1 的实际结果使用不同的颜色（可能还有稍微不同的符号），这也会有所帮助。这是一个原始示例：