推荐系统通过从用户特征和历史行为推断偏好来过滤对用户有价值的内容/项目。主流方法遵循学习排名范式,重点是发现和建模项目主题(例如, ...

0 0 0 0 2025/11/29 arXiv:2505.10940v3 yqstar

个性化推荐系统影响着用户的大部分在线选择,但其目标性质使得区分推荐价值和基础商品具有挑战性。我们构建了一个离散选择模型,该模型嵌入了推荐诱导的效用、低秩异质性和灵活的状态依赖性,并将该模型应用于 Netflix 的收视率数据。我们利用推荐算法引入的特殊变化来识别和单独评估这些组件,并恢复可用于验证结构模型的无模型转移率。我们使用该模型来评估反事实,以量化个性化推荐所产生的增量参与度。首先,我们表明,用矩阵分解或基于流行度的算法替换当前的推荐系统将分别导致参与度下降 4% 和 12%,并降低消费多样性。其次,推荐带来的消费增长大部分来自有效的定位,而不是机械曝光,其中中等受欢迎程度的商品收益最大(而不是具有广泛吸引力或非常利基的商品) ...

0 0 0 0 2025/11/13 arXiv:2511.07280v2 yqstar

用于训练推荐系统的隐式反馈不可避免地会遇到由于误点击和位置偏差等因素而产生的噪音。先前的研究试图通过不同的数据模式(例如较高的损失值)来识别噪声样本,并通过样本丢弃或重新加权来减轻其影响。然而,我们观察到噪声样本和硬样本显示相似的模式,导致硬噪声混淆问题。这种混乱是有问题的,因为硬样本对于建模用户偏好至关重要。为了解决这个问题,我们提出了 LLMHNI 框架,利用大型语言模型(LLM)生成的两个辅助用户项相关性信号来区分硬样本和噪声样本。 LLMHNI 从 LLM 编码的嵌入中获取用户-项目语义相关性,该嵌入用于负采样以选择硬负例,同时滤除噪声假负例。提出了一种客观对齐策略,将最初用于一般语言任务的 LLM 编码嵌入投影到针对用户-项目相关性建模优化的表示空间中。 LLMHNI 还利用用户-项目交互中 LLM 推断的逻辑相关性来识别硬样本和噪声样本。这些 LLM 推断的交互被集成到交互图中,并通过跨图对比对齐指导去噪。为了消除 LLM 幻觉引起的不可靠交互的影响,我们提出了一种图对比学习策略,该策略将随机边缘丢弃视图的表示对齐以抑制不可靠的边缘。实证结果表明,LLMHNI 显着提高了去噪和推荐性能 ...

0 1 0 0 2025/11/13 arXiv:2511.07295v2 yqstar

大语言模型 (LLM) 的最新突破从根本上将推荐系统从判别式转变为生成式,其中用户行为建模是通过生成以历史交互为条件的目标项目来实现的。然而,当前的生成推荐器仍然面临两个核心限制:缺乏高质量的负面模型和对隐性奖励的依赖。具有可验证奖励的强化学习(RLVR)通过实现更难的负样本的策略采样和显式奖励信号的基础优化,提供了一种自然的解决方案 ...

0 0 0 0 2025/10/15 arXiv:2510.12211v1 yqstar

回归模型对于推荐系统至关重要。但是,社区内已明显忽略了转化的偏见问题。尽管其他领域的许多作品都设计了有效的偏见校正方法,但所有这些方法都是在模型外部进行事后治疗的,当应用于现实世界中的推荐系统时,面临实际挑战 ...

0 0 0 0 2025/10/12 arXiv:2505.13881v5 yqstar

居住时间(DT)是点击点点击指标,用于评估推荐系统中的用户偏好,并补充传统的点击率(CTR)。尽管多任务学习被广泛采用以共同优化DT和CTR,但我们观察到,多任务模型系统地将其DT预测系统崩溃到了最短和最长的垃圾箱,从而不足以预测适度的持续时间。我们将这种中等含量的代表性不足归因于对CTR-DT伪造相关性的过度依赖,并提议用因果关系来解决它 ...

0 0 0 0 2025/09/17 arXiv:2508.16573v1 yqstar

我们提出了一个通用模型不合时宜的学习框架,具有反事实样本合成(CCSS),用于建模神经网络输出与数值之间的单调性,这对于建议系统的解释性和有效性至关重要。 CCSS通过两个阶段的过程对单调性进行建模:合成反事实样本并与反事实样本进行对比。这两种技术自然集成到模型不足的框架中,形成了端到端的训练过程 ...

0 0 0 0 2025/09/11 arXiv:2509.03187v1 yqstar

在在线视频平台中,准确的观看时间预测已成为视频推荐中的一个基本且具有挑战性的问题。先前的研究表明,观察时间预测的准确性在很大程度上取决于手表标签的转换和估计过程的分解。 TPM(基于树的渐进回归模型)通过精心设计和有效的分解范式实现最先进的性能 ...

0 0 0 0 2025/09/04 arXiv:2505.22153v2 yqstar

观看时间广泛用作视频推荐平台中用户满意度的代理。但是,原始手表时间受到混杂因素的影响,例如视频持续时间,受欢迎程度和个人用户行为,可能会扭曲偏好信号,并导致偏见的建议模型。我们提出了一个新颖的相对优势偏见框架,该框架通过将观察时间与以用户和项目组为条件的经验得出的参考分布进行比较来纠正观察时间 ...

0 0 0 0 2025/08/19 arXiv:2508.11086v1 yqstar

最近的研究表明,深度神经网络没有得到很好的校准,并且通常会产生过度自信的预测。错误校准问题主要源于在分类中使用跨凝性,该分类旨在将预测的SoftMax概率与一速标签保持一致。在序数回归任务中,此问题会受到一个额外的挑战:预期软磁性概率应表现出单型分布的期望 ...

0 1 0 0 2025/08/13 arXiv:2410.15658v3 yqstar