我使用Cramer 的 V来计算仅由名义特征组成的数据集中的特征的相关性。
让我们考虑以下数据集:
a | b
--------
0 | 0
0 | 1
0 | 0
1 | 2
1 | 2
1 | 3
计算特征的 Cramer's Va并b得到 0.707。由于它是对称的,因此在这种情况下存在信息丢失 - 正如我们所看到的,知道 的值b意味着我们肯定知道的值是多少a,但是如果给定 的值,情况就不是这样了a;在这种情况下,可能值的数量会b减少,但仍不确定。
我想找到一个不对称的度量标准,它可以为标称值提供这些信息 - 意思是,在计算a->b和b->时会给出不同的值a。有这样的吗?