我正在训练预训练的 SSD-InceptionV2-Coco来检测“汽车”,
这是mscoco label中的类之一。
我用来自 KITTI 的约 50k 样本训练模型,500k 迭代,批量大小为 2。
我按照这个脚本生成了 tfrecord 文件。
然后我用一个视频测试原始的预训练模型和我的训练模型。
我训练的模型的性能更差。更多缺失的检测结果。
我最近发现的一件事是,当 AvgNumGroundtruthBoxesPerImage 增加时,classification_loss/localization_loss 也会增加。
编辑
我发现的另一件事是我拥有的每张图像有更多的真实框,
我拥有的每张图像的平均正锚数量越少。
这让我很困扰,因为如果每个图像生成的锚点数量是固定的,
更多的地面实况框应该为每张图像提供更多的正锚。
所以我想知道在哪里找到根本原因。
欢迎任何建议。
感谢您在我的问题上花费宝贵的时间。