一译 —— 文档和论文翻译、对照阅读、讨论和社区

Large Language Models and Emergence: A Complex Systems Perspective

出现是复杂性科学中的一个概念，它描述了多体系统表现出新的高级特性，可以通过用较低维有效变量和理论代替高维机制来描述这些属性。这是由“更多是不同”的想法所捕获的。智能是一种出现的紧急财产，表现出越来越有效的效率 - 更便宜，更快地使用了新兴能力来解决问题 ...

0 0 0 2025/06/18 arXiv:2506.11135v1 mosymxl

GMT: General Motion Tracking for Humanoid Whole-Body Control

追踪现实世界中一般全身运动的能力是构建通用人形机器人机器人的有用方法。但是，由于动议的时间和运动学多样性，政策能力以及上部和下部协调的难度，实现这一目标可能具有挑战性。为了解决这些问题，我们提出了GMT，GMT是一个通用且可扩展的运动跟踪框架，该框架训练单个统一的政策，以使人形机器人能够跟踪现实世界中的各种动议 ...

0 0 0 2025/06/18 arXiv:2506.14770v1 晚餐杀手

Learning to Ask: When LLM Agents Meet Unclear Instruction

现代大型语言模型（LLM）配备了调用功能的功能，可以利用外部工具来仅通过语言技能来解决一系列无法实现的任务。但是，这些工具的有效执行不仅依赖于LLM的高级功能，而且还取决于精确的用户说明，这些说明通常无法在现实世界中确保。为了评估LLMS工具使用的性能在不完美的说明下，我们精心仔细检查了从用户查询的实际说明，分析错误模式并构建一个具有挑战性的工具使用基准标准，称为噪音工具台（NoisyTool ...

0 0 0 2025/06/18 arXiv:2409.00557v3 arxiv

From Experts to a Generalist: Toward General Whole-Body Control for Humanoid Robots

由于各种运动需求和数据冲突，实现对类人形机器人的一般敏捷全身控制仍然是一个重大挑战。尽管现有的框架在培训单运动特定政策方面表现出色，但由于控制要求冲突和数据分布不匹配，他们努力跨越高度不同的行为。在这项工作中，我们提出了Bumblebee（BB），这是一个专家学习框架，结合了运动聚类和SIM卡对现实的改编以克服这些挑战 ...

0 0 0 2025/06/18 arXiv:2506.12779v1 晚餐杀手

ColCOS$Φ$: A Multiple Pheromone Communication System for Swarm Robotics and Social Insects Research

在过去的几十年中，我们目睹了社会昆虫的信息素如何成为群体机器人技术的丰富灵感来源。通过利用物理群机器人系统中的虚拟信息素来协调个体并实现诸如社交昆虫之类的直接/间接机器人间通信，就出现了柱头行为。但是，许多研究在解决群问题方面仅考虑一个单一的信息素，在实际昆虫中并非如此 ...

0 0 0 2025/06/18 arXiv:1905.11160v2 小胖猴

Exploring the Individuality and Collectivity of Intents behind Interactions for Graph Collaborative Filtering

意图建模在推荐系统中引起了广泛的关注。作为用户选择项目背后的核心动机，意图对于阐明建议结果至关重要。当前的主流建模方法是将意图抽象为不可知但可学习的共享或非共享参数 ...

0 0 0 2025/06/18 arXiv:2405.09042v1 CG_Z

From Sora What We Can See: A Survey of Text-to-Video Generation

有了令人印象深刻的成就，人工智能正处于人工通用智能的前进方向。由Openai开发的Sora，能够具有微小级别的世界模拟能力，可以将其视为这一发展道路上的里程碑。但是，尽管取得了显着的成功，但索拉仍然遇到需要解决的各种障碍 ...

0 0 0 2025/06/18 arXiv:2405.10674v1 lizijian9630

GVPO: Group Variance Policy Optimization for Large Language Model Post-Training

训练后在精炼和调整大型语言模型以满足特定任务和人类偏好方面起着至关重要的作用。尽管训练后技术的最新进步，例如小组相对政策优化（GRPO），但利用相对奖励评分来提高采样以实现卓越的表现，但这些方法通常会遭受训练不稳定的影响，从而限制了其实际采用。为了应对这一挑战，我们提出了小组差异策略优化（GVPO） ...

0 0 1 2025/06/18 arXiv:2504.19599v2 wangximeng

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）