我有一个看起来像这样的特征向量表-
这是一个包含 156 列或特征的表。我想在应用我的分类模型之前应用特征选择算法。
这就是我正在使用的 -
dataset = pd.read_csv('.csv')
X = dataset.iloc[:, 1:157].values
y = dataset.iloc[:,0].values
##normalize
scaler = MinMaxScaler()
scaler.fit(X)
MinMaxScaler(copy=True, feature_range=(0, 1))
X_normalized = scaler.transform(X)
##feature selection
sel = SelectKBest(chi2, k='all')
sel.fit_transform(X_normalized, y)
print(sel.scores_)
这是print(sel.scores_)我得到的结果-
可以看出,它们并不都在 0 和 1 之间。
我将这篇研究论文作为我的来源-
来源- http://courses.ischool.berkeley.edu/i256/f06/papers/yang97comparative.pdf



