GO-SLAM
- Description:GO-SLAM 论文笔记 (读 arXiv 全文后所写) — DROID 稠密 BA + 全局回环/全局 BA + Instant-NGP(哈希编码 + 隐式 SDF) 即时更新地图的神经隐式 SLAM,强调全局一致
- Paper:Zhang, Y. [Youmin], Tosi, F., Mattoccia, S., & Poggi, M. (2023). GO-SLAM: Global Optimization for Consistent 3D Instant Reconstruction. ICCV 2023. arXiv:2309.02436
- K2E-B ID:[K2E-B-G5-6]
- Max3 PDF:
[K2E] SLAM/[K2E-B-G] Geometry & Rendering/[K2E-B-G5] NeRF SLAM/[K2E-B-G5-6][2023] GO-SLAM Global Optimization for Consistent 3D Instant Reconstruction.pdf - Notion ID:(待创建)
- Created:2024-03-31
- Updated:2026-06-02
- License:转载欢迎 — 请署名 Yu Zhang 并链回 yuzhang.io 原文
Table of Contents
1. 概述
GO-SLAM (Zhang et al. 2023, 博洛尼亚大学, ICCV) — 神经隐式 SLAM,核心是全局一致 (global consistency):在 DROID-SLAM 稠密 BA 基础上加回环检测 + 全局 BA,并让 Instant-NGP 隐式 SDF 地图随位姿全局更新即时重建。
解决前作 (iMAP/NICE-SLAM/Vox-Fusion) 痛点:无回环 → 长轨迹漂移累积,地图不一致。支持单目 / 双目 / RGB-D。
DROID-SLAM 见 Deep VO 系列;Instant-NGP 见 Instant-NGP (G6-2)。本笔记读 arXiv 全文。
2. 三线程架构
- 前端跟踪 (DROID 风格):基于 RAFT 的循环更新算子(光流作内部几何代理)→ 帧图 (frame graph) → 局部稠密 BA 出位姿 + 视差/深度;含关键帧初始化 + 回环检测
- 后端跟踪 (全局 BA):在整个 frame graph 上做全局 BA,全局校正所有关键帧位姿与深度
- 即时建图:Instant-NGP(多分辨率哈希编码 + SDF),订阅最新全局位姿,实时重新对齐重建
3. 全局优化 — 回环 + 全局 BA
- 回环检测 (前端线程):用关键帧间平均刚性光流衡量共视,均值小于阈值 $\tau_{co}$ (=25) 为回环候选 → 建边,发现长期闭环
- 全局 BA:在整个 frame graph 上做稠密 BA (不只滑窗),把闭环误差均摊回全轨迹 → 消漂移
- 关键:全局 BA 改变历史位姿后,地图必须同步更新 (否则旧位姿建的几何错位)
4. 即时隐式 SDF 建图
- 用 Instant-NGP 多分辨率哈希编码预测隐式 SDF $\Phi(x)$ + 颜色 (NeuS 式 SDF 体渲染;见 Instant-NGP)
- 监听后端全局位姿变化 → 地图在线重新对齐而非重训
- 实现 "全局 BA 改位姿 ↔ 隐式 SDF 地图即时跟随" 的一致重建,实时运行
5. 对比
| NICE-SLAM / Vox-Fusion | GO-SLAM | |
|---|---|---|
| 回环/全局 BA | 无 (纯增量) | 有 (核心卖点) |
| 跟踪 | RGB-D 隐式优化 | DROID 稠密 BA (单/双/RGB-D) |
| 长轨迹一致性 | 漂移累积 | 全局校正,一致 |
| 建图后端 | 特征网格 / 体素 SDF | Instant-NGP(哈希编码 + 隐式 SDF),随位姿即时更新 |
GO-SLAM 把经典 SLAM 的全局优化 (回环 + 全局 BA) 引入神经隐式重建,是该方向"全局一致"的代表作。
References
- Zhang, Y. [Youmin], Tosi, F., Mattoccia, S., & Poggi, M. (2023). GO-SLAM: Global Optimization for Consistent 3D Instant Reconstruction. ICCV 2023. arXiv:2309.02436 — 论文 (本笔记读 arXiv 全文整理)
- 跟踪后端 DROID-SLAM (Teed & Deng 2021);渲染后端见 Instant-NGP (G6-2);增量对比见 NICE-SLAM / Vox-Fusion