我正在尝试训练一个分类器来预测不同郊区商品的不同价格。我有几个特征,其中两个是郊区质心的纬度和经度。
我正在尝试训练模型对 10 美元大小的箱子中的物品价格进行分类。地理空间元素肯定会影响商品的价格,但是我拥有的训练数据会有差距(即我没有所有郊区的价格)。
设计包含此地理空间信息并能够填补训练/测试数据空白的功能的最佳方法是什么?
到目前为止,我已经尝试为与首都的方位和距离创建新的特征,这似乎工作正常,以及对表现比方位/距离差的纬度和经度进行分箱。我确实考虑过使用 geohash,但是我认为这对于分类器来说太复杂了,无法理解。
