顺序推荐旨在通过对类似用户或项目的历史行为进行协作过滤(CF)信号进行建模来预测用户的未来交互。传统的顺序推荐器主要依赖于基于ID的嵌入,该嵌入方式通过高阶共发生模式捕获CF信号。但是,这些嵌入完全取决于过去的相互作用,缺乏可转移的知识来推广到看不见的领域 ...
多模式建议主要集中于有效利用行为和多模式信息来进行推荐任务。但是,大多数现有模型在从两个不同域中融合信息时都会遇到以下问题:(1)以前的作品仅通过仅使用直接串联,添加或简单的线性图层来提取模态信息提取而充分注意对模态信息的充分利用。 (2)以前的作品将模态特征视为可学习的嵌入,这会导致模态嵌入在学习过程中逐渐偏离原始模态特征 ...
当前的多模式顺序推荐模型通常无法有效地探索和捕获不同模态的用户和项目之间的行为序列之间的相关性,要么忽略了序列表示之间的相关性,要么在其表示中忽略了多模态数据和序列数据之间的关联。为了解决这个问题,我们在顺序建议的背景下探索了多模式的预训练,以增强多模式信息的融合和利用。我们为顺序推荐(MP4SR)框架提出了一种新颖的多模式预训练,该框架利用对比度损失来捕获用户不同模态序列之间的相关性,以及用户和 ...
有效,准确的运动预测对于确保自主驾驶中的安全性和明智的决策至关重要,尤其是在需要多模式预测的动态现实世界中。我们介绍了Trajflow,这是一种基于流动匹配的新型运动预测框架,该框架解决了现有生成轨迹预测方法的可扩展性和效率挑战。与采用i的常规生成方法不同 ...
非政策评估(OPE)旨在仅使用离线记录的数据准确评估反事实策略的性能。尽管已经开发了许多估计器,但没有单个估计器主导其他估计器,因为估计器的准确性可能会大大差异,具体取决于给定的OPE任务,例如评估策略,操作数量和噪声水平。因此,数据驱动的估计器选择问题变得越来越重要,并且可能对OPE的准确性产生重大影响 ...
A/B测试对于现代技术公司评估针对标准基线的新开发产品的有效性至关重要。本文研究了最佳设计,旨在最大程度地提高从在线实验获得的信息量,以准确估计治疗效果。我们在动态环境中提出了三种最佳分配策略,其中处理随着时间的推移会顺序分配 ...
仿真虽然在准确复制现实世界系统方面有力,但由于其复杂性,非技术用户通常仍然无法访问。相反,大型语言模型(LLMS)提供了直观的,基于语言的互动,但可能缺乏可靠地模拟复杂现实世界动态所需的结构化的,因果理解。我们介绍了我们的模拟代理框架,这是一种整合模拟模型和LLM的优势的新方法 ...
在这项工作中,研究了通过经济模型预测控制(MPC)对蛇机器人运动的控制。仅存在MPC应用于蛇机器人的极少数示例,并且缺少严格的递归可行性和收敛性证明。我们提出了一种经济MPC算法,该算法最大化了机器人的前进速度,并将步态模式的选择纳入封闭环 ...