一译 —— 文档和论文翻译、对照阅读、讨论和社区

Be.FM: Open Foundation Models for Human Behavior

尽管它们在许多领域取得了成功，但基础模型建模和理解人类行为的潜力仍然在很大程度上尚未探索。我们介绍了此HTTP URL，这是为人类行为建模设计的第一个开放基础模型之一。该HTTP URL建立在开源大型语言模型上，并在各种行为数据上进行了微调，可用于理解和预测人类的决策 ...

0 0 0 2025/07/02 arXiv:2505.23058v1 晚餐杀手

Fast Adaptation with Behavioral Foundation Models

无监督的零射强增强学习（RL）已成为预处理行为基础模型（BFMS）的强大范式，使代理商能够以零拍的方式（即，即没有其他测试时间学习或计划）来解决通过零摄影方式指定的广泛下游任务 ...

0 0 0 2025/07/02 arXiv:2504.07896v1 晚餐杀手

A Survey on Vision-Language-Action Models for Autonomous Driving

多模式大语言模型（MLLM）的快速进步为视觉语言动作（VLA）范式铺平了道路，这些范式将视觉感知，自然语言理解和控制范围整合在单个策略中。自主驾驶的研究人员正在积极将这些方法调整为车辆域。这样的型号承诺可以解释高级说明，有关复杂交通场景的原因并做出自己的决定的自动驾驶汽车 ...

0 0 0 2025/07/02 arXiv:2506.24044v1 jane88

Omnigrasp: Grasping Diverse Objects with Simulated Humanoids

我们提出了一种控制模拟的类人动物以抓住对象并将其移动以遵循对象轨迹的方法。由于在用灵巧的手控制类人动物方面面临的挑战，先前的方法通常使用无形的手，仅考虑垂直升降机或短轨迹。这种有限的范围妨碍了对动画和模拟所需的对象操纵的适用性 ...

0 0 0 2025/07/02 arXiv:2407.11385v2 晚餐杀手

HumanMimic: Learning Natural Locomotion and Transitions for Humanoid Robot via Wasserstein Adversarial Imitation

将人类运动技能转移到人形机器人仍然是一个重大挑战。在这项研究中，我们介绍了Wasserstein对抗性模仿学习系统，允许人形机器人复制自然的全身运动模式，并通过模仿人体动作来执行无缝的过渡。首先，我们提出了统一的原始骨骼运动重新定位，以减轻任意人类示威者和人形机器人之间的形态差异 ...

0 1 0 2025/07/02 arXiv:2309.14225v4 mark

SiM3D: Single-instance Multiview Multimodal and Multisetup 3D Anomaly Detection Benchmark

我们提出了SIM3D，这是第一个基准，即考虑到全面的3D异常检测和分割（ADS）的多模式和多模式信息的集成，其中任务是产生基于Voxel的异常体积。此外，SIM3D重点介绍了对制造业浓厚兴趣的方案：单稳定异常检测，其中只有一个物体可用于培训。在这方面，SIM3D是第一个针对从合成训练数据到实际测试数据的概括的挑战的ADS基准 ...

0 0 0 2025/07/02 arXiv:2506.21549v1 KingXHJ

How Do Recommendation Models Amplify Popularity Bias? An Analysis from the Spectral Perspective

推荐系统（RS）通常会受到流行偏见的困扰。当在典型的长尾数据集上训练推荐模型时，该模型不仅倾向于继承这种偏见，而且经常加剧它，从而导致推荐列表中流行项目的过度代表。这项研究进行了全面的经验和理论分析，以揭示这种现象的根本原因，产生了两个核心见解：1）项目流行度在建议模型预测的分数矩阵的主要光谱中记住； 2）维度崩溃现象扩大了主要光谱的相对突出，从而加剧了普及偏差 ...

0 0 0 2025/07/02 arXiv:2404.12008v6 chenjl

Stronger Baselines for Retrieval-Augmented Generation with Long-Context Language Models

随着能够在单个通行证中处理数万个 Token 的长篇文章模型（LMS）的兴起，多阶段检索生成一代（RAG）管道是否仍然为简单，单阶段的方法提供可衡量的好处吗？为了评估这个问题，我们对系统缩放的 Token 预算进行了对质量检查任务的受控评估，比较了两个最近的多阶段管道，Readagent和Raptor，与三个基线，包括Dos Rag（文档的原始结构RAG），一种简单的回传方法，是一种保留原始通道订 ...

0 0 0 2025/07/02 arXiv:2506.03989v1 lb47719448

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）