GO-SLAM


  • Description:GO-SLAM 论文笔记 (读 arXiv 全文后所写) — DROID 稠密 BA + 全局回环/全局 BA + Instant-NGP(哈希编码 + 隐式 SDF) 即时更新地图的神经隐式 SLAM,强调全局一致
  • Paper:Zhang, Y. [Youmin], Tosi, F., Mattoccia, S., & Poggi, M. (2023). GO-SLAM: Global Optimization for Consistent 3D Instant Reconstruction. ICCV 2023. arXiv:2309.02436
  • K2E-B ID:[K2E-B-G5-6]
  • Max3 PDF[K2E] SLAM/[K2E-B-G] Geometry & Rendering/[K2E-B-G5] NeRF SLAM/[K2E-B-G5-6][2023] GO-SLAM Global Optimization for Consistent 3D Instant Reconstruction.pdf
  • Notion ID:(待创建)
  • Created:2024-03-31
  • Updated:2026-06-02
  • License转载欢迎 — 请署名 Yu Zhang 并链回 yuzhang.io 原文

Table of Contents


1. 概述

GO-SLAM (Zhang et al. 2023, 博洛尼亚大学, ICCV) — 神经隐式 SLAM,核心是全局一致 (global consistency):在 DROID-SLAM 稠密 BA 基础上加回环检测 + 全局 BA,并让 Instant-NGP 隐式 SDF 地图随位姿全局更新即时重建

解决前作 (iMAP/NICE-SLAM/Vox-Fusion) 痛点:无回环 → 长轨迹漂移累积,地图不一致。支持单目 / 双目 / RGB-D。

DROID-SLAM 见 Deep VO 系列;Instant-NGP 见 Instant-NGP (G6-2)。本笔记读 arXiv 全文。

2. 三线程架构

  1. 前端跟踪 (DROID 风格):基于 RAFT 的循环更新算子(光流作内部几何代理)→ 帧图 (frame graph) → 局部稠密 BA 出位姿 + 视差/深度;含关键帧初始化 + 回环检测
  2. 后端跟踪 (全局 BA):在整个 frame graph 上做全局 BA,全局校正所有关键帧位姿与深度
  3. 即时建图:Instant-NGP(多分辨率哈希编码 + SDF),订阅最新全局位姿,实时重新对齐重建

3. 全局优化 — 回环 + 全局 BA

  • 回环检测 (前端线程):用关键帧间平均刚性光流衡量共视,均值小于阈值 $\tau_{co}$ (=25) 为回环候选 → 建边,发现长期闭环
  • 全局 BA:在整个 frame graph 上做稠密 BA (不只滑窗),把闭环误差均摊回全轨迹 → 消漂移
  • 关键:全局 BA 改变历史位姿后,地图必须同步更新 (否则旧位姿建的几何错位)

4. 即时隐式 SDF 建图

  • 用 Instant-NGP 多分辨率哈希编码预测隐式 SDF $\Phi(x)$ + 颜色 (NeuS 式 SDF 体渲染;见 Instant-NGP)
  • 监听后端全局位姿变化 → 地图在线重新对齐而非重训
  • 实现 "全局 BA 改位姿 ↔ 隐式 SDF 地图即时跟随" 的一致重建,实时运行

5. 对比

NICE-SLAM / Vox-Fusion GO-SLAM
回环/全局 BA 无 (纯增量) (核心卖点)
跟踪 RGB-D 隐式优化 DROID 稠密 BA (单/双/RGB-D)
长轨迹一致性 漂移累积 全局校正,一致
建图后端 特征网格 / 体素 SDF Instant-NGP(哈希编码 + 隐式 SDF),随位姿即时更新

GO-SLAM 把经典 SLAM 的全局优化 (回环 + 全局 BA) 引入神经隐式重建,是该方向"全局一致"的代表作。

References

  • Zhang, Y. [Youmin], Tosi, F., Mattoccia, S., & Poggi, M. (2023). GO-SLAM: Global Optimization for Consistent 3D Instant Reconstruction. ICCV 2023. arXiv:2309.02436 — 论文 (本笔记读 arXiv 全文整理)
  • 跟踪后端 DROID-SLAM (Teed & Deng 2021);渲染后端见 Instant-NGP (G6-2);增量对比见 NICE-SLAM / Vox-Fusion