我正在尝试生成一个机器学习模型,它可以作为真实数据的插值器。本质上,进入模型的是xy
坐标,结果将是图像。这是为了在每个像素级别表征相机。
我尝试使用网络( )输入原始xy
坐标并生成许多图像,但这并没有很好地收敛。x*y
conv
unet
然后我尝试用一个白色的单个xy
像素输入全黑图像,但由于输出图像大部分是黑色的,它通过使整个输出变为黑色来欺骗。然后我尝试将输出图像裁剪为仅感兴趣的区域,但它再次难以产生任何真正的变化,并且通过肉眼只能制作出宽泛的白色图像。
是否有解决图像中坐标的标准方法?我只需要训练很长时间吗?迁移学习会有帮助吗?图像有比 更好的损失函数mse
吗?