我正在尝试掌握相机校准的窍门。为此,我主要在youtube上观看了这个讲座:Lecture 12: Camera Model by UCF CRCV。我相信我理解了主要思想:
我们主要处理将 3D 世界点与 2d 图像点相关联的问题。为此
- 我们采用齐次坐标(在定义的世界坐标系中)的 3D 点 W
- 应用变换(旋转、平移)以使相机和世界坐标系对齐
- 使用透视投影(来自针孔相机模型)计算图像点 I。
如果我们没有透视投影(即内在参数)并且我们没有相机在世界中的位置和方向(外在参数),我们可以通过使用具有容易找到的点的对象来计算它们(=校准)世界,识别拍摄图像中的那些点并建立一个方程组,然后我们可以使用最小二乘法求解。
我现在注意到,许多校准工具实际上需要多个图像才能可靠地校准。关于这个,我有几个问题:
- 我们如何关联我们可能从我们移动的同一个对象中拍摄的多个图像?我见过世界原点经常放在棋盘的角落里,但是如果你移动棋盘,这个原点就会改变。原点不必匹配,这样我们就可以计算多个图像的外部参数吗?
- 为什么使用多个图像更好?难道你不能用一个大棋盘来给你足够多的点来解方程组吗?