SLAM初学-视觉里程计（二）

date

Apr 14, 2022

Last edited time

May 16, 2022 01:09 PM

status

Published

slug

SLAM初学-视觉里程计（二）

光流法

假设条件

灰度不变假设：同一个空间点的像素灰度值，在各个图像中是固定不变的。

作用

光流是一种描述像素随着时间，在图像之间运动的方法，如图所示。随着时间的经过，同一个像素会在图像中运动，而我们希望追踪它的运动过程。即得到像素的运动。

分类

计算部分像素运动的称为稀疏光流，计算所有像素的称为稠密光流。稀疏光流以 Lucas-Kanade 光流为代表，并可以在 SLAM 中用于跟踪特征点位置。

Lucas-Kanade 光流

在 LK 光流中，我们认为来自相机的图像是随时间变化的。图像可以看作时间的函数：。那么，一个在时刻，位于处的像素，它的灰度。

推导

对于时刻位于处的像素，我们设时刻，它运动到处。由于灰度不变，我们有：

对左边进行泰勒展开，保留一阶项:

由于灰度不变假设：

两边除以，得：

令：

则：

由于该式是带有两个变量的一次方程，仅凭它无法计算出。因此，必须引入额外的约束来计算。在 LK 光流中，我们假设某一个窗口内的像素具有相同的运动。

考虑一个大小为大小的窗口，它含有数量的像素。由于该窗口内像素具有同样的运动，因此我们共有个方程：

令：

则：

最小二乘回顾

由最小二乘法：

多层光流

我们把光流写成了优化问题，就必须假设优化的初始值靠近最优值，才能在一定程度上保障算法的收敛。如果相机运动较快，两张图像差异较明显，那么单层图像光流法容易达到一个局部极小值。这种情况可以通过引入图像金字塔来改善。

图像金字塔是指对同一个图像进行缩放，得到不同分辨率下的图像，如图82所示。以原始图像作为金字塔底层，每往上一层，就对下层图像进行一定倍率的缩放，就得到了一个金字塔。

然后，在计算光流时，先从顶层的图像开始计算，然后把上一层的追踪结果，作为下一层光流的初始值。由于上层的图像相对粗糙，所以这个过程也称为由粗至精(Coarse-to-fine)的光流，也是实用光流法的通常流程。

Code

在代码实现中，我们求解一个

的问题来优化。另外，第二个图像的梯度也可以使用第一个图像的梯度来替代，成为反向法。

直接法

假设

灰度不变假设：同一个空间点的像素灰度值，在各个图像中是固定不变的。

作用

优化相机的运动，使运动前后空间点对应的两个相机平面的像素值差异最小。与光流法不同，不直接得到像素的运动，而是直接得到相机的运动。

直接法需要输入深度图，得到信息。

单层光流法

考虑某个空间点和两个时刻的相机，的世界坐标为，它在两个相机平面上成像的像素坐标为。

我们的目标是求第一个相机到第二个相机的相对位姿变换。我们以第一个相机为参照系，设第二个相机的旋转和平移为 (对应李群为)。同时，两相机的内参相同，记为。为清楚起见，我们列写完整的投影方程：

其中是P的深度，是P在第二个相机坐标系下的深度。由于需要与其次坐标相乘，因此乘完之后需要取出前个元素。

此时，我们将光度误差作为最小化的目标，因此，目标函数可以写为：

当我们有个空间点，则相机位姿估计问题可以写为：

我们定义两个中间变量：

这里的为在第二个相机坐标系下的坐标，为其在相机平面上的像素坐标。显然，是的函数，是的函数，从而也是的函数。考虑李代数的左扰动模型，利用一阶泰勒展开：

其中为的左扰动。

为处的像素梯度。

为投影方程关于相机坐标系下的三维点的导数，记，则导数为

为变换后的三位点对变换的导数

在实践中，由于后两项只与三维点有关，而与图像无关，我们经常把它合并在一起：

于是，我们推导出误差相对于李代数的雅可比矩阵：

对于N个点的问题，我们可以用这种方法计算优化问题的雅可比矩阵，然后使用高斯牛顿法或列文伯格一马夸尔特方法计算增量，迭代求解。

直接法的特点

最后，我们总结直接法的优缺点。大体上，它的优点如下：

可以省去计算特征点、描述子的时间。

只要求有像素梯度即可，不需要特征点。因此，直接法可以在特征缺失的场合下使用。比较极端的例子是只有渐变的一幅图像。它可能无法提取角点类特征，但可以用直接法估计它的运动。在演示实验中，我们看到直接法对随机选取的点亦能正常工作。这一点在实用中非常关键，因为实用场景很有可能没有很多角点可供使用。

可以构建半稠密乃至稠密的地图，这是特征点法无法做到的。

它的缺点也很明显：

非凸性。直接法完全依靠梯度搜索，降低目标函数来计算相机位姿。其目标函数中需要取像素点的灰度值，而图像是强烈非凸的函数。这使得优化算法容易进入极小，只在运动很小时直接法才能成功。针对于此，金字塔的引入可以在一定程度上减小非凸性的影响。

单个像素没有区分度。和它像的实在太多了！于是我们要么计算图像块，要么计算复杂的相关性。由于每个像素对改变相机运动的“意见”不一致，只能少数服从多数，以数量代替质量。所以，直接法在选点较少时的表现下降明显，我们通常建议用500个点以上。

灰度值不变是很强的假设。如果相机是自动曝光的，当它调整曝光参数时，会使得图像整体变亮或变暗。光照变化时也会出现这种情况。特征点法对光照具有一定的容忍性，而直接法由于计算灰度间的差异，整体灰度变化会破坏灰度不变假设，使算法失败。针对这一点，实用的直接法会同时估计相机的曝光参数0，以便在曝光时间变化时也能工作。