sswwpplyy的文档

sswwpplyy

个性签名 ...

Gaussian Splatting SLAM

我们首次将 3D 高斯分布应用于使用单个移动单目或 RGB-D 相机进行增量 3D 重建。我们的同步定位和建图 (SLAM) 方法以 3fps 实时运行，利用高斯作为唯一的 3D 表示，统一了准确、高效的跟踪、建图和高质量渲染所需的表示。需要多项创新才能从实时摄像机持续重建高保真度的 3D 场景 ...

0 0 0 0 2024/12/12 arXiv:2312.06741v2 sswwpplyy

DrivingGaussian: Composite Gaussian Splatting for Surrounding Dynamic Autonomous Driving Scenes

我们推出 DrivingGaussian，这是一个针对动态自动驾驶场景的高效且有效的框架。对于具有移动物体的复杂场景，我们首先使用增量静态 3D 高斯函数顺序渐进地对整个场景的静态背景进行建模。然后，我们利用复合动态高斯图来处理多个移动对象，单独重建每个对象并恢复它们在场景中的准确位置和遮挡关系 ...

0 0 0 0 2024/05/21 arXiv:2312.07920v3 sswwpplyy

Periodic Vibration Gaussian: Dynamic Urban Scene Reconstruction and Real-time Rendering

由于高度复杂的几何结构以及空间和时间上不受约束的动态，对动态的大规模城市场景进行建模具有挑战性。先前的方法通常采用高级架构先验，将静态和动态元素分开，导致无法最佳地捕捉它们的协同相互作用。为了应对这一挑战，我们提出了一个统一的表示模型，称为周期振动高斯（PVG） ...

0 1 0 0 2024/05/20 arXiv:2311.18561v2 sswwpplyy

4D Gaussian Splatting for Real-Time Dynamic Scene Rendering

表示和渲染动态场景一直是一项重要但具有挑战性的任务。特别是，要准确地模拟复杂的运动，通常很难保证高效率。为了实现实时动态场景渲染，同时享受高训练和存储效率，我们提出 4D 高斯分布（4D-GS）作为动态场景的整体表示，而不是对每个单独的帧应用 3D-GS ...

0 0 0 0 2024/05/15 arXiv:2310.08528v2 sswwpplyy

Street Gaussians for Modeling Dynamic Urban Scenes

本文旨在解决利用单目视频对动态城市街道场景进行建模的问题。最近的方法通过将履带式车辆姿态与动画车辆相结合来扩展 NeRF，从而实现动态城市街道场景的照片级真实感视图合成。然而，其显着的局限性是训练和渲染速度慢，加上对跟踪车辆姿态的高精度的迫切需求 ...

0 0 0 0 2024/05/15 arXiv:2401.01339v1 sswwpplyy

Occ3D: A Large-Scale 3D Occupancy Prediction Benchmark for Autonomous Driving

机器人感知需要对3d几何和语义进行建模。现有方法通常侧重于估计3d边界框，忽略更精细的几何细节，并且难以处理一般的、词汇外的对象。3d占用预测可估计场景的详细占用状态和语义，是克服这些限制的一项新兴任务... ...

0 0 1 2 2025/05/16 arXiv:2304.14365v3 sswwpplyy

FB-OCC: 3D Occupancy Prediction based on Forward-Backward View Transformation

本技术报告总结了 3D 占用预测挑战赛的获奖解决方案，该挑战赛与 CVPR 2023 端到端自动驾驶研讨会和 CVPR 23 以视觉为中心的自动驾驶研讨会联合举办。我们提出的解决方案 FB-OCC 以 FB-BEV 为基础，FB-BEV 是一种基于相机的尖端鸟瞰感知设计，使用前后投影。在 FB-BEV 之上，我们进一步研究针对 3D 占用预测任务的新颖设计和优化，包括联合深度语义预训练、联合体素 BEV 表示、模型放大和有效的后处理策略 ...

0 0 0 0 2024/05/08 arXiv:2307.01492v1 sswwpplyy

Mip-NeRF 360: Unbounded Anti-Aliased Neural Radiance Fields

尽管神经辐射场（NeRF）在物体和小空间有限区域上展示了令人印象深刻的视图合成结果，但它们在“无界”场景中表现不佳，在“无界”场景中，相机可能指向任何方向，内容可能存在于任何距离。在这种情况下，现有的类似 NeRF的模型通常会产生模糊或低分辨率的渲染训练（由于附近速度和近距离物体的细节和比例不平衡），很慢，并且由于任务的固有模糊性可能会出现伪影。从一个小组图像重建我们提出了mip-NeRF（一种解决采样和混叠问题的NeRF变体）的扩展，它使用非线性场景参数化、在线补充和新颖的基于失真的正则化器来克服无界场景带来的挑战... ...

0 0 0 0 2025/01/15 arXiv:2111.12077v3 sswwpplyy

UniOcc: Unifying Vision-Centric 3D Occupancy Prediction with Geometric and Semantic Rendering

在本技术报告中，我们介绍了名为 UniOCC 的解决方案，用于 CVPR 2023 的 nuScenes 开放数据集挑战赛中以视觉为中心的 3D 占用预测赛道。现有的占用预测方法主要侧重于使用 3D 占用优化 3D 体积空间上的投影特征标签。然而，这些标签的生成过程复杂且昂贵（依赖于3D语义注释），并且受体素分辨率的限制，它们无法提供细粒度的空间语义 ...

0 0 1 1 2024/04/29 arXiv:2306.09117v1 sswwpplyy

UniSim: A Neural Closed-Loop Sensor Simulator

严格测试自主系统对于使安全的自动驾驶车辆 (SDV) 成为现实至关重要。它需要生成超出世界上可以安全收集的安全关键场景，因为许多场景很少发生在公共道路上。为了准确评估性能，我们需要在闭环中测试这些场景中的 SDV，其中 SDV 和其他参与者在每个时间步相互交互 ...

0 0 1 1 2024/04/26 arXiv:2308.01898v1 sswwpplyy