我有一个从一个来源提取的大约 4000 个元素的特征数组。在这个数组上,我从其他来源提取了另外 7 个特征,现在基本上每个数据点都有一个 4007 特征数组。我试图根据这个特征数组对这些数据点进行分类,基本上是用曼哈顿距离做一个 1NN。
然而,由于我的数学真的很差,我不知道如何衡量这个,所以我的 7 个元素实际上可以帮助解决这个问题。感觉这 4000 个元素更重要,而在距离计算中,其他 7 个元素微不足道。
我也将此输入提供给神经网络,我想知道是否还需要在那里预处理某些东西,或者我可以将 4007 元素提供给输入神经元吗?
我已经完成了特征缩放,但我想这与我要问的问题无关。