我们提出了一种在静态和动态环境下进行单图像 3D 长方体目标检测和多视图目标 SLAM 的方法,并证明这两个部分可以相互改进。首先,对于单图像目标检测,我们从 2D 边界框和消失点采样生成高质量的长方体提案。根据与图像边缘的对齐情况对建议进行进一步评分和选择 ...
在非结构化、未探索的环境中运行的微型飞行器 (MAV) 需要快速、灵活的本地规划,以便在探索地图的新部分时重新规划。轨迹优化方法满足这些需求,但需要障碍物距离信息,该信息可以由欧几里德符号距离场(ESDF)给出。我们提出了一种从截断符号距离场(TSDF)增量构建 ESDF 的方法,TSDF 是计算机图形和视觉中使用的常见隐式表面表示 ...
本文档介绍了 PLVS:一种利用稀疏 SLAM、体积映射和 3D 无监督增量分割的实时系统。 PLVS 代表点、线、体积映射和分割。它支持 RGB-D 和立体相机,可以选择配备 IMU ...
在本文中,我们提出了一种高效的视觉 SLAM 系统,旨在解决短期和长期的照明挑战。我们的系统采用混合方法,将用于特征检测和匹配的深度学习技术与传统的后端优化方法相结合。具体来说,我们提出了一个统一的卷积神经网络(CNN),可以同时提取关键点和结构线 ...
全球定位是长期、无漂移机器人导航所需的基本能力。然而,当前的方法在面对明显不同的观点时无法重新定位。我们提出了 ROMAN(Robust Object Map Alignment Anywhere),这是一种强大的全局定位方法,能够基于创建和对齐开放集和视图不变对象的地图,在具有挑战性和多样化的环境中进行本地化 ...
了解自主机器人运行的场景对于其正常运行至关重要。这种场景理解需要识别交通参与者的实例以及一般场景语义,这可以通过全景分割任务有效地解决。在本文中,我们介绍了高效全景分割(EfficientPS)架构,该架构由共享主干组成,该主干可有效编码和融合语义丰富的多尺度特征 ...
我们通过提取、建模和优化语义道路元素,提出了一种自动驾驶车辆视觉映射和定位的新方法。具体来说,我们的方法集成了级联深度模型来检测标准化道路元素而不是传统的点特征,以寻求改进的姿态精度和地图表示紧凑性。为了利用结构特征,我们通过路灯和标志的骨架和边界的代表性深度关键点对路灯和标志进行建模,并通过分段三次样条对车道进行参数化 ...
对于机器人来说,要有效地个性化物理援助,它必须学习用户的偏好,这些偏好通常可以重新应用于未来的场景。在这项工作中,我们研究了使用机器人进行家庭清洁的个性化,这些机器人可以通过捡起物体并将其收起来来整理房间。一个关键的挑战是确定放置每个对象的适当位置,因为人们的喜好可能会根据个人品味或文化背景而有很大差异 ...
深度视觉同步定位与建图 (SLAM) 技术(例如 DROID)通过在密集流场上利用深度视觉里程计取得了重大进展 ...
机器人导航已被视为 3D 重建和规划问题以及端到端学习问题。然而,远程导航需要对局部可通行性进行规划和推理,并且能够以路线图、GPS 或其他提供重要线索的辅助信息的形式利用有关全球地理的常识。在这项工作中,我们提出了一种整合学习和规划的方法,可以利用示意性路线图、卫星地图和 GPS 坐标等辅助信息作为规划启发式方法,而不依赖于它们的准确性 ...