LLM解码是通过从高带宽内存中加载键值(KV)缓存的大批次和长上下文的瓶颈,该缓存膨胀了,该存储器会膨胀延迟的延迟,而解码限制的顺序性质则是并行性。我们分析了算术强度,并行化以及模型质量之间的相互作用,并质疑当前的体系结构是否完全利用现代硬件。这项工作重新设计了注意力以执行从内存加载的每个字节的更多计算,以最大程度地提高硬件效率,而无需交易并行可扩展性 ...
向量数据库已成为一种新类型的系统,该系统支持高维向量的有效查询。其中许多将其数据库作为云中的服务。但是,各种可用的CPU以及跨CPU缺乏矢量搜索基准,使用户很难选择一个 ...
能够在不同环境下自主操作的人形机器人长期以来一直是机器人专家的目标。然而,人形机器人的自主操作在很大程度上仅限于某一特定场景,这主要是由于难以获得通用技能。 3D 视觉运动策略(例如 3D 扩散策略 (DP3))的最新进展已显示出将这些功能扩展到更野外环境的希望 ...
机器人描述模型对于模拟和控制至关重要,但是它们的创建通常需要大量的手动努力。为了简化此建模过程,我们介绍了Autourdf,这是一种无监督的方法,用于从点云框架构建描述文件的描述文件。我们的方法利用基于群集的点云注册模型,该模型跟踪点簇的6-DOF变换 ...
本文介绍了分层扩散策略(HDP),这是多任务机器人操作的分层代理。 HDP将操纵策略分解为层次结构:高级任务规划剂,可预测遥远的下一最终效果姿势(NBP),以及一个低级目标条件条件的扩散策略,该策略会产生最佳的运动轨迹。分解的政策表示允许HDP在产生细粒度的低水平动作的同时解决这两个长马任务计划 ...
最近,基于 Transformer 的机器人操纵方法利用多视图的空间表示和语言说明来学习机器人运动轨迹,来利用众多机器人演示。但是,机器人数据的收集非常具有挑战性,现有方法缺乏仅使用少数演示的新任务进行持续学习的能力。在本文中,我们将这些挑战提出为少量动作的学习(FSAIL)任务,并因此设计了一个任务促进的图形演变策略(主题)来解决这些问题 ...
对点云的自我监督的表示学习表明,在改善跨不同任务的预培训模型绩效方面具有有效性。但是,随着预训练的模型的复杂性增长,将它们完全微调用于下游应用程序需要大量的计算和存储资源。参数有效的微调(PEFT)方法提供了一种有希望的解决方案来减轻这些资源需求,但是大多数当前的方法都依赖于增加可调参数的复杂适配器和及时的机制 ...
时间序列数据存在于现实世界系统和服务的每个角落,从天空中的卫星到人体可穿戴设备。通过从这些时间序列中提取和推断出有价值的信息来进行学习表示对于理解特定现象的复杂动态和实现知情决策至关重要。借助学习的表示,我们可以更有效地执行许多下游分析 ...