如何称重特征数组

数据挖掘 神经网络 特征缩放 k-nn
2022-03-07 05:59:30

我有一个从一个来源提取的大约 4000 个元素的特征数组。在这个数组上,我从其他来源提取了另外 7 个特征,现在基本上每个数据点都有一个 4007 特征数组。我试图根据这个特征数组对这些数据点进行分类,基本上是用曼哈顿距离做一个 1NN。

然而,由于我的数学真的很差,我不知道如何衡量这个,所以我的 7 个元素实际上可以帮助解决这个问题。感觉这 4000 个元素更重要,而在距离计算中,其他 7 个元素微不足道。

我也将此输入提供给神经网络,我想知道是否还需要在那里预处理某些东西,或者我可以将 4007 元素提供给输入神经元吗?

我已经完成了特征缩放,但我想这与我要问的问题无关。

1个回答

监督机器学习的目标是自动学习特征权重以预测目标值。

如果您有目标值,则可以拟合机器学习算法(例如,k-最近邻或神经网络)。

无需自己选择权重,算法会为您完成。