我正在尝试检查垃圾邮件和工作日之间是否存在相关性。我的数据集如下所示:
Spam? Day
0 1.0 Saturday
1 1.0 Saturday
3 0.0 Saturday
5 1.0 Saturday
7 0.0 Friday
... ... ...
346 0.0 Friday
348 1.0 Friday
361 0.0 Saturday
383 1.0 Thursday
387 1.0 Friday
其中 1 表示垃圾邮件,0 表示垃圾邮件。
我试过如下
corr = (numpy.corrcoef(df['Spam?'],df['Days']))
我不知道如何解释这两个变量之间可能存在的关系,以及绘图是否有助于更好地可视化数据和关系。