计算机视觉和 3D 重建中的一个问题是获取相机的内在参数。一个常见的解决方案是使用一个事先知道其形状测量值的对象,例如棋盘。这种方法的问题在于,每次相机参数(例如焦距和放大倍率)发生变化时都必须这样做。
我正在尝试实现A Simple Technique for Self-Calibration中讨论的相机自校准。本质矩阵受其两个奇异值的约束。这可用于在不进行手动校准(即使用棋盘格)的情况下恢复相机的内在特性。我对如何最小化成本函数感到有些困惑。到目前为止,这是我的理解:
基本矩阵
内在矩阵
- 焦距和放大倍数的乘积 [求解]
- 纵横比 [假设提供,我猜来自相机或 EXIF 数据?]
- 是主点的坐标 [假设 0, 0]
- 偏斜 [假设 0]
成本函数
这s 是奇异值
问题:如何最小化这个成本函数?