人类自然地依赖平面图在不熟悉的环境中导航,因为它们容易获得、可靠,并提供丰富的几何指导。然而,现有的视觉导航设置忽视了这一宝贵的先验知识,导致效率和准确性有限。为了消除这一差距,我们引入了一种新颖的导航任务:平面图视觉导航(FloNa),这是将平面图纳入具体视觉导航的首次尝试 ...

0 0 0 0 2024/12/31 arXiv:2412.18335v1 lucian_p

地点识别是机器人导航的关键模块。现有的研究主要集中在视觉地点识别上,仅根据外观来识别以前访问过的地点。在本文中,我们通过基于结构外观(即距离传感器)识别位置来解决结构位置识别问题 ...

0 0 0 0 2024/12/25 arXiv:2109.13494v1 lucian_p

我们引入了一种新颖的 3D 生成方法,用于创建多功能且高质量的 3D 资产。其基础是统一的结构化 LATent (SLAT) 表示,它允许解码为不同的输出格式,例如辐射场、3D 高斯和网格。这是通过将稀疏的 3D 网格与从强大的视觉基础模型中提取的密集多视图视觉特征相集成来实现的,全面捕获结构(几何)和纹理(外观)信息,同时保持解码过程中的灵活性 ...

0 0 0 0 2024/12/24 arXiv:2412.01506v1 lucian_p

我们提出了一种实时 LiDAR-惯性相机 SLAM 系统,以 3D Gaussian Splatting 作为映射后端。本文利用我们的激光雷达惯性相机里程计 Coco-LIC 的稳健姿态估计,提出了一种增量真实感测绘系统。我们从彩色 LiDAR 点初始化 3D 高斯,并使用由 3D 高斯 Splatting 提供支持的可微渲染来优化它们 ...

0 0 0 0 2024/12/19 arXiv:2404.06926v2 lucian_p

本文针对室内场景提出了一种低漂移单目 SLAM 方法,其中单目 SLAM 经常因缺乏纹理表面而失败。我们的方法将跟踪过程的旋转和平移估计解耦,以减少室内环境中的长期漂移。为了充分利用场景中可用的几何信息,卷积神经网络根据每个输入 RGB 图像实时预测表面法线 ...

0 0 0 0 2024/12/19 arXiv:2008.01963v1 lucian_p

立体匹配旨在估计立体图像对中匹配像素之间的差异,这对于机器人、自动驾驶和其他计算机视觉任务非常重要。尽管近年来开发了许多令人印象深刻的方法,但确定最适合实际应用的架构仍然具有挑战性。为了解决这一差距,我们的论文引入了一个全面的基准测试,重点关注实际适用性,而不是仅仅关注单个模型以优化性能 ...

0 0 0 0 2024/12/17 arXiv:2312.00343v8 lucian_p

在本文中,我们提出了一种新颖的密集面元映射系统,只需 CPU 计算即可在不同环境中很好地扩展。使用稀疏 SLAM 系统来估计相机位姿,所提出的地图系统可以将强度图像和深度图像融合成全局一致的模型。该系统经过精心设计,可以使用 RGB-D 相机、立体相机甚至单目相机的深度图像构建从房间规模的环境到城市规模的环境 ...

0 0 0 0 2024/12/14 arXiv:1909.04250v1 lucian_p

让多摄像头视觉SLAM系统更易于设置、对环境更鲁棒性一直是视觉机器人关注的焦点之一。现有的单目和双眼视觉 SLAM 系统的 FoV 较窄,在无纹理环境中很脆弱,精度会下降,鲁棒性有限。因此,多摄像头 SLAM 系统越来越受到关注,因为它们可以为宽视场的纹理退化提供冗余 ...

0 0 0 0 2024/12/14 arXiv:2412.03146v1 lucian_p

当前的视觉惯性里程计(VIO)方法能够通过非线性优化获得高精度的状态估计。然而,随着轨迹随着时间的推移而增长,实时优化很快变得不可行,惯性测量的高速率进一步加剧了这个问题,从而导致优化中变量数量的快速增长。在本文中,我们通过将选定关键帧之间的惯性测量预先集成到单个相对运动约束中来解决这个问题 ...

0 0 0 0 2024/12/13 arXiv:1512.02363v3 lucian_p

从单个 RGB 图像进行 6D 姿态估计是计算机视觉中的一项基本任务。当前表现最好的基于深度学习的方法依赖于间接策略,即 ...

0 0 0 0 2024/12/02 arXiv:2102.12145v3 lucian_p

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)