NeRF-SLAM (Rosinol)


  • Description:NeRF-SLAM 论文笔记 (读 arXiv 全文后所写) — 实时稠密单目 SLAM = DROID-SLAM 稠密跟踪 + 深度不确定性加权监督 Instant-NGP 辐射场
  • Paper:Rosinol, A., Leonard, J. J., & Carlone, L. (2023). NeRF-SLAM: Real-Time Dense Monocular SLAM with Neural Radiance Fields. Proc. IEEE/RSJ IROS 2023. arXiv:2210.13641
  • K2E-B ID:[K2E-B-G5-3]
  • Max3 PDF[K2E] SLAM/[K2E-B-G] Geometry & Rendering/[K2E-B-G5] NeRF SLAM/[K2E-B-G5-3][2022] NeRF-SLAM Real-Time Dense Monocular SLAM with Neural Radiance Fields.pdf
  • Notion ID:(待创建)
  • Created:2024-03-31
  • Updated:2026-06-02
  • License转载欢迎 — 请署名 Yu Zhang 并链回 yuzhang.io 原文

Table of Contents


1. 概述

NeRF-SLAM (Rosinol, Leonard, Carlone 2023, MIT SPARK Lab) — 实时稠密单目 SLAM。流水线 = DROID-SLAM 稠密跟踪 (产位姿 + 稠密深度 + 深度不确定性) + Instant-NGP 辐射场建图 (用深度监督,按不确定性加权)。

核心创新:稠密深度图有噪声,用深度不确定性加权深度 loss 监督 NeRF → 避免被噪声深度带偏。

DROID-SLAM 是稠密光流+BA 跟踪 (见 K2E-B Deep VO 系列);Instant-NGP 见 Instant-NGP (G6-2);本笔记读 arXiv 全文。

2. 跟踪 — DROID-SLAM

DROID-SLAM 模块:

  • ConvGRU 算相邻帧稠密光流 + 光流权重
  • 稠密 Bundle Adjustment (逆深度参数化) → 位姿 + 每像素深度图
  • 系统方程线性化为相机/深度块状稀疏 Hessian (Schur 补处理)

3. 深度不确定性

从 Hessian 块结构经 Schur 补 求边缘协方差 (见 边缘化 那篇):

$$ \Sigma_T = (L L^T)^{-1} \quad \text{(位姿协方差, Cholesky)} $$ $$ \Sigma_d = P^{-1} + P^{-T} E^T \Sigma_T E P^{-1} \quad \text{(深度协方差, 含位姿不确定性)} $$

4. 建图 — 不确定性加权监督

把图像、位姿、深度图、深度不确定性喂给 Instant-NGP 辐射场训练 (位姿不确定性 Σ_T 间接进入:经 E^T Σ_T E 耦合到深度协方差 Σ_d)。深度 loss 按深度协方差加权:

$$ \mathcal{L}D = | D - D^*(T, \Theta) |^2{\Sigma_D} $$

(Mahalanobis 距离,见 高斯滤波家族 §1) — 不确定的深度 (远点/弱纹理) 权重小。消融显示不加权会有偏、收敛慢

5. 结果

Replica 上比 NICE-SLAM:PSNR 最高提升 179% (Replica office-1 最优,非全场景平均),L1 深度精度最高好 86%,实时 ~12 fps (640×480;跟踪线程 ~15 fps、建图线程 ~10 fps)。纯单目做到稠密 + 辐射场是亮点。

References

  • Rosinol, A., Leonard, J. J., & Carlone, L. (2023). NeRF-SLAM: Real-Time Dense Monocular SLAM with Neural Radiance Fields. Proc. IEEE/RSJ IROS 2023. arXiv:2210.13641 — 论文 (本笔记读 arXiv 全文整理)
  • Teed, Z., & Deng, J. (2021). DROID-SLAM. NeurIPS. — 稠密跟踪后端
  • Instant-NGP 见 Instant-NGP (G6-2);不确定性/Schur 见 边缘化 + 高斯滤波家族