我正在用一本指导书分析来自 Kaggle 1的泰坦尼克号数据。在本书中,关于 Pclass 数据和 Survived 数据之间关系的特征分析如下所示。
train_set = pd.read_csv('train_csv)
fig = plt.figure(figsize=(12,4))
ax1 = fig.add_subplot(121)
PclassPlot = train_set['Survived].groupby(train_set['Pclass]).mean()
ax.bar(x=PClassPlot.index, height=PClassPlot.values)
为什么需要使用平均数据?
我认为我不需要计算平均值来查看 Pclass 和 Survived 数据之间的关系。
请给我一些分析数据的技巧。感谢您的帮助。