基于增强学习的推荐系统(基于RL的RS)旨在通过向多步决策任务投入建议,从一批收集的数据中学习良好的政策。但是,当前基于RL的RS研究通常具有较大的现实差距。在本文中,我们介绍了第一个开源现实世界数据集RL4RS,希望替换人工数据集和半模拟的RS数据集,因为基于RL的RS RS域的资源限制,使用了先前使用的研究 ...
现代推荐系统是建立在计算密集型基础架构的基础上的,并且由于计算资源有限,对每个请求,尤其是在高峰期进行实时计算是一项挑战。当系统无法提供实时建议时,通过用户的结果推荐将纳维斯库广泛使用。但是,分配实时和缓存的建议以最大程度地提高用户的整体参与是一项挑战 ...
在现实推荐方案中,用户通过各种行为参与项目。利用多元化的用户行为信息进行学习可以增强目标行为的建议(例如 ...
转化率 (CVR) 预测是数字展示广告最关键的任务之一。商业系统通常需要以在线学习的方式更新模型,以跟上不断变化的数据分布。然而,转化通常不会在用户点击后立即发生 ...
转化率 (CVR) 预测的困难之一是转化可能会延迟并在点击后很长时间才会发生。延迟的反馈带来了挑战:新数据有利于持续训练,但在将其摄入训练管道时可能没有完整的标签信息。为了平衡模型新鲜度和标签确定性,以前的方法会设置较短的等待窗口,甚至不等待转换信号 ...
在展示广告中,预测转化率,即用户在广告商的网站上采取预定义操作(例如购买商品)的概率,对于评估展示广告的价值至关重要。然而,点击和最终转化之间存在相对较长的时间延迟。由于反馈延迟,训练期间的一些正面实例被标记为负面,因为在收集训练数据时尚未发生一些转换 ...
准确估算点击后转化率 (CVR) 在电子商务中至关重要。然而,CVR预测在实践中通常面临三大挑战:i)数据稀疏性:与曝光量相比,转化样本往往极其稀缺; ii) 样本选择偏差:传统的 CVR 模型使用点击印象进行训练,同时对所有印象的整个空间进行推断; iii)延迟反馈:许多转化只有在点击发生后经过相对较长且随机的延迟才能观察到,导致训练期间出现许多假阴性标签。以往的研究主要集中于一两个问题,而忽略了其他问题 ...
预测点击后转化(购买或其他事件)的预期价值或数量是基于效果的数字广告的一项关键任务。在训练转化优化器模型时,最关键的方面之一是处理与转化相关的延迟反馈,这可能会以不同的延迟多次发生。这项任务很困难,因为每个广告商的延迟分布都不同,是长尾的,通常不遵循任何特定类别的参数分布,并且会随着时间的推移而变化 ...
用户建模对于个性化 Web 应用程序至关重要。现有的用户建模方法通常使用特定于任务的标记数据根据用户行为来训练用户模型。然而,目标任务中的标记数据可能不足以训练准确的用户模型 ...
尽管多模态数据在提高模型精度方面具有公认的潜力,但许多大型工业推荐系统(包括淘宝展示广告系统)主要依赖于模型中的稀疏ID特征。在这项工作中,我们探索利用多模态态数据来推荐提高准确性的方法。我们首先确定对工业系统有效且具有成本效益的方式采用多模式数据的关键挑战...... ...