数据集:在 8 组属性上测量的混凝土。约 4000 个数据点。
已知:在理想条件下,10 种不同类型混凝土的 8 个属性值。
目标是找到:在 8 维空间中,给定数据点最接近的“混凝土类型”是什么。
如果我的话令人困惑,我认为图像很好地解释了这个问题。黑色 = 想法条件。红色 = 需要确定类别的点。
澄清:
from sklearn.neighbors import KNeighborsClassifier
knn = KNeighborsClassifier(n_neighbors=8)
knn.fit(X_train, y_train)
pred = knn.predict(X_test)
如果我理解正确,可以接受:X_train 将是 8 x 10 的数组,Y_train 将是 1 x 10 的数组。这是正确的吗?
