用于二进制分类任务的 pearson r 统计的类比

数据挖掘 分类
2022-02-26 09:02:32

我试图了解我的数据变量如何与目标变量(二进制类)相对应。

在回归中,Pearson r 统计量可以很好地理解变量关系。我也可以将它用于分类,将 0 类和 1 类视为真实值,但这是一个冒险的把戏。

我的问题:是否有任何等效的统计数据说明哪个变量对分类任务有好处?谢谢

1个回答

Pearson 卡方测试可能会为您提供所需的内容: https ://en.wikipedia.org/wiki/Pearson%27s_chi-squared_test

这是分析分类数据的好资源: https ://en.wikipedia.org/wiki/List_of_analysiss_of_categorical_data

此外,混淆矩阵也很有帮助: https ://en.wikipedia.org/wiki/Confusion_matrix