我们提出了Light3R-SFM,这是一种从无约束的图像收集中从无约束的图像收集中有效的大规模结构(SFM)的端到端学习框架。与现有的SFM解决方案依靠昂贵的匹配和全球优化来实现准确的3D重建,Light3R-SFM通过一种新型的潜在全球对齐模块来解决这一限制。该模块用可学习的注意机制代替了传统的全局优化,从而有效地捕获了图像跨图像的多视图约束,从而获得了稳健和精确的相机姿势估计 ...
多视图3D重建仍然是计算机视觉中的核心挑战,尤其是在需要各种视角的准确和可扩展表示的应用中。当前的领先方法(例如DUST3R)采用了基本的成对方法,成对处理图像,并需要昂贵的全球对齐程序从多个视图中重建。在这项工作中,我们提出了快速的3D重建(FAST3R),这是一种对DUST3R的新型多视图概括,通过并行处理许多视图来实现有效且可扩展的3D重建 ...
在本文中,我们介绍了Splatt3R,这是一种无姿势的,馈送的方法,用于野外3D重建,并从立体声配对中介绍了新型视图合成。给定未校准的自然图像,Splatt3R可以预测3D高斯夹板,而无需任何相机参数或深度信息。为了概括性,我们通过将其扩展以处理3D结构和外观来构建``基础''3D几何重建方法MAST3R ...
我们提出了一个实时的单眼密集大满贯系统,该系统由MAST3R(两视图3D重建和匹配之前)设计为自下而上。配备了这种强大的先验,我们的系统在野外视频序列上虽然没有在唯一的相机中心之外的固定或参数摄像头模型上做出假设。我们介绍了用于指数匹配,相机跟踪和本地融合,图形结构和循环闭合以及二阶全局优化的有效方法 ...