现代大型语言模型(LLM)配备了调用功能的功能,可以利用外部工具来仅通过语言技能来解决一系列无法实现的任务。但是,这些工具的有效执行不仅依赖于LLM的高级功能,而且还取决于精确的用户说明,这些说明通常无法在现实世界中确保。为了评估LLMS工具使用的性能在不完美的说明下,我们精心仔细检查了从用户查询的实际说明,分析错误模式并构建一个具有挑战性的工具使用基准标准,称为噪音工具台(NoisyTool ...
由于各种运动需求和数据冲突,实现对类人形机器人的一般敏捷全身控制仍然是一个重大挑战。尽管现有的框架在培训单运动特定政策方面表现出色,但由于控制要求冲突和数据分布不匹配,他们努力跨越高度不同的行为。在这项工作中,我们提出了Bumblebee(BB),这是一个专家学习框架,结合了运动聚类和SIM卡对现实的改编以克服这些挑战 ...
在过去的几十年中,我们目睹了社会昆虫的信息素如何成为群体机器人技术的丰富灵感来源。通过利用物理群机器人系统中的虚拟信息素来协调个体并实现诸如社交昆虫之类的直接/间接机器人间通信,就出现了柱头行为。但是,许多研究在解决群问题方面仅考虑一个单一的信息素,在实际昆虫中并非如此 ...
意图建模在推荐系统中引起了广泛的关注。作为用户选择项目背后的核心动机,意图对于阐明建议结果至关重要。当前的主流建模方法是将意图抽象为不可知但可学习的共享或非共享参数 ...
有了令人印象深刻的成就,人工智能正处于人工通用智能的前进方向。由Openai开发的Sora,能够具有微小级别的世界模拟能力,可以将其视为这一发展道路上的里程碑。但是,尽管取得了显着的成功,但索拉仍然遇到需要解决的各种障碍 ...
训练后在精炼和调整大型语言模型以满足特定任务和人类偏好方面起着至关重要的作用。尽管训练后技术的最新进步,例如小组相对政策优化(GRPO),但利用相对奖励评分来提高采样以实现卓越的表现,但这些方法通常会遭受训练不稳定的影响,从而限制了其实际采用。为了应对这一挑战,我们提出了小组差异策略优化(GVPO) ...
视觉语言模型 (VLM) 中现有的图像文本模态对齐以自回归方式平等地对待每个文本标记。尽管简单有效,但这种方法会过度强调与输入图像相关性较低甚至矛盾的文本标记,从而导致次优的跨模式对齐。在本文中,我们主张根据每个文本标记的视觉相关性为其分配不同的贡献 ...
近年来,大型语言模型(LLMS)的广泛采用引起了人们对在军事领域中应用的潜力的兴趣。但是,由于域特异性词汇和行话的流行,当前一代的LLMS在陆军用例中表现出了次优的性能。为了完全利用LLM In构想,许多组织已转向微调,以规避从头开始培训新LLMS所涉及的艰巨的成本 ...