嗨,我正在开展一个项目,该项目需要You Only Look Once算法来对图像中的对象进行分类和定位。我必须准备我的数据集(它有 2 个类,每个网格单元预测 6 个对象,并且 448 * 448 图像被拆分为 7*7 网格)。什么是可行的方法来做到这一点?我 在这篇文章中找到了这段代码。但是我不明白他为什么做了他所做的事情,例如他为什么专门检查“盒子”的第 24 个元素,那么我必须检查盒子的哪个元素?是否有任何教程贯穿其中?有人可以解释甚至调整他的方法以适应我的数据集吗?
仅供参考:我正在从头开始编写 YOLO 算法