我有一个看起来像这样的数据集-
我正在尝试使用 chi2 作为其上的特征选择算法。这是代码
dataset = pd.read_csv('small_dataset.csv')
print(dataset.shape)
X = dataset.iloc[:, 1:106].values
y = dataset.iloc[:,0].values
print(sklearn.feature_selection.chi2(X, y))
我试图验证 sklearn 的答案和公式
所以我采用了第一个特征并计算了 ABCD,它们是 0 19 73 73,N 是 146。所以 X2 值是 21,但在 sklearn 中它是 579。
我究竟做错了什么?


