jerome.zhou的文档

jerome.zhou

个性签名 ...

UniTraj: A Unified Framework for Scalable Vehicle Trajectory Prediction

车辆轨迹预测越来越依赖于数据驱动的解决方案，但它们扩展到不同数据域的能力以及较大数据集大小对其泛化的影响仍有待探索。虽然可以通过使用多个数据集来研究这些问题，但由于存在一些差异，因此具有挑战性 ...

0 0 0 0 2024/04/26 arXiv:2403.15098v2 jerome.zhou

GoRela: Go Relative for Viewpoint-Invariant Motion Forecasting

运动预测任务对于自动驾驶车辆 (SDV) 能够规划安全的操作至关重要。为了实现这一目标，现代方法对地图、智能体过去的轨迹及其相互作用进行推理，以产生准确的预测。主要的方法是在每个目标代理的参考框架中对地图和其他代理进行编码 ...

0 0 0 0 2024/04/24 arXiv:2211.02545v2 jerome.zhou

SIMPL: A Simple and Efficient Multi-agent Motion Prediction Baseline for Autonomous Driving

本文提出了一种用于自动驾驶车辆的简单高效的运动预测基线（SIMPL）。与精度高但重复计算的传统以代理为中心的方法以及精度和通用性受到影响的以场景为中心的方法不同，SIMPL 为所有相关交通参与者提供实时、准确的运动预测。为了提高准确性和推理速度，我们提出了一种紧凑而高效的全局特征融合模块，该模块以对称方式执行定向消息传递，使网络能够在单次前馈传递中预测所有道路使用者的未来运动，并减轻视点移动导致的精度损失 ...

0 0 0 0 2024/04/22 arXiv:2402.02519v1 jerome.zhou

Dynamic Scenario Representation Learning for Motion Forecasting with Heterogeneous Graph Convolutional Recurrent Networks

由于动态场景中复杂且多变的交互，运动预测是自动驾驶中的一个具有挑战性的问题。大多数现有工作利用静态道路图来描述场景，并且在动态场景中不断变化的时空依赖性建模方面受到限制。在本文中，我们利用动态异构图来对场景进行建模 ...

0 0 0 0 2024/04/16 arXiv:2303.04364v1 jerome.zhou

CLIP-BEVFormer: Enhancing Multi-View Image-Based BEV Detector with Ground Truth Flow

自动驾驶是计算机视觉的关键领域，塑造着交通的未来。在这个范式中，系统的主干在解释复杂环境中发挥着至关重要的作用。然而，一个显着的挑战是鸟瞰元素缺乏明确的监管 ...

0 0 0 0 2024/04/03 arXiv:2403.08919v1 jerome.zhou

FEDformer: Frequency Enhanced Decomposed Transformer for Long-term Series Forecasting

尽管基于 Transformer 的方法显着改善了长期序列预测的最新结果，但它们不仅计算成本昂贵，更重要的是无法捕获时间序列的全局视图（例如总体趋势） ...

0 0 1 7 2024/03/29 arXiv:2201.12740v3 jerome.zhou

SpectFormer: Frequency and Attention is what you need in a Vision Transformer

视觉转换器已成功应用于图像识别任务。已经有类似于文本模型中的原始工作的基于多头自注意力（ViT \cite{dosovitskiy2020image}、DeIT、\cite{touvron2021training}）或最近基于谱层（Fnet\cite{lee2021fnet}， GFNet\cite{rao2021global}、AFNO\cite{guibas2021efficient}）。我们假设光谱注意力和多头注意力都发挥着重要作用 ...

0 0 0 0 2024/03/29 arXiv:2304.06446v2 jerome.zhou

Fourier Features Let Networks Learn High Frequency Functions in Low Dimensional Domains

我们证明，通过简单的傅里叶特征映射传递输入点使多层感知器（MLP）能够学习低维问题域中的高频函数。这些结果揭示了计算机视觉和图形领域的最新进展，通过使用 MLP 来表示复杂的 3D 对象和场景，实现了最先进的结果。使用神经正切核 (NTK) 文献中的工具，我们表明标准 MLP 在理论和实践中都无法学习高频 ...

0 0 0 0 2024/03/25 arXiv:2006.10739v1 jerome.zhou

QCNeXt: A Next-Generation Framework For Joint Multi-Agent Trajectory Prediction

估计道路智能体未来轨迹的联合分布对于自动驾驶至关重要。在这份技术报告中，我们提出了一种称为 QCNeXt 的下一代联合多智能体轨迹预测框架。首先，我们采用以查询为中心的编码范式来完成联合多智能体轨迹预测的任务 ...

0 0 0 0 2024/03/25 arXiv:2306.10508v1 jerome.zhou

SEPT: Towards Efficient Scene Representation Learning for Motion Prediction

运动预测对于自动驾驶汽车在复杂交通环境中安全运行至关重要。提取交通要素之间有效的时空关系是准确预测的关键。受预训练大型语言模型成功实践的启发，本文提出了 SEPT，这是一种利用自我监督学习来开发对复杂交通场景的强大时空理解的建模框架 ...

0 0 0 0 2024/03/19 arXiv:2309.15289v4 jerome.zhou