背景:我正在学习 CNN 的机器学习本科 CS 课程之外。我有几个与 CNN 相关的问题。
1) 在训练 CNN 时,我们希望获得所需类别的紧密边界/裁剪图像,对吗?即,如果我们试图识别狗,我们将使用数千张剪得很短的狗的图像。我们也会提供非狗的图像,对吗?这些图像被缩放到特定大小,即 255x255。
2)假设训练完成。我们模型的准确性似乎足够,没有问题。从这里开始,让我们有一张未遮挡的狗在有各种障碍物的田野中奔跑的大型高清图像。使用典型的 NN 和一些数据,我们只需获取模型,将其与一些输入交叉,然后 bam 它将输出一些类。CNN 将如何查看这个大图像,然后“找到”狗?我们是否对图像运行某种类型的预处理来对其进行分区,并为分区提供数据?