我似乎在为我的 CNN 网络建模时遇到了问题。
我想从不同大小的图像中提取特征向量。与图像一致的是y轴和颜色维度,但x轴不是恒定的。
根据 x 轴的长度,特征向量的长度也会改变。我已经知道它们应该有多长,但不知道 x 轴长度与特征向量长度之间的比率,我猜确实存在。
是否可以训练一个 CNN 网络,使其可以根据图像 x 轴的输入长度来改变特征向量长度?
我似乎在为我的 CNN 网络建模时遇到了问题。
我想从不同大小的图像中提取特征向量。与图像一致的是y轴和颜色维度,但x轴不是恒定的。
根据 x 轴的长度,特征向量的长度也会改变。我已经知道它们应该有多长,但不知道 x 轴长度与特征向量长度之间的比率,我猜确实存在。
是否可以训练一个 CNN 网络,使其可以根据图像 x 轴的输入长度来改变特征向量长度?
在普通 CNN 上,实际上不可能改变每个示例的输入特征数组大小。相反,这是在第一次构建模型时,在您开始训练之前修复的。
根据您的目标,可能可以使用某种与图像补丁一起工作的管道来解决这个问题(采用多个稍微随机的补丁来增加训练数据可以改善结果,并且对预测输入做同样的事情也可以提高分类器的准确性)。或者更复杂的变体,使用 RNN/CNN 混合将图像作为部分序列来消费,这也可能用于多对象识别。
但是,这些解决方案很复杂,并且可以通过更简单的技术(例如进行中心裁剪和/或填充)来实现图像分类的最新结果。如果您的训练数据也以相同的方式处理,并且纵横比不是极端的,这可以充分发挥作用。