一译 —— 文档和论文翻译、对照阅读、讨论和社区

Directly Aligning the Full Diffusion Trajectory with Fine-Grained Human Preference

最近的研究表明，使用可区分的奖励将直接对齐扩散模型与人类偏好保持有效性。但是，他们表现出两个主要挑战：（1）他们依靠多步降级，并用梯度计算来进行奖励评分，这在计算上昂贵，因此仅将优化限制为仅几个扩散步骤； （2）他们通常需要连续离线奖励模型，以实现所需的美学质量，例如光真相或精确的照明效应。为了解决多步降级的局限性，我们提出了直接对齐，这种方法在通过插值从任何时间步骤中有效地从任何时间步骤中恢复了 ...

0 1 0 2025/09/12 arXiv:2509.06942v3 fengdragon

Impression-Aware Recommender Systems

新颖的数据来源带来了新的机会，可以提高推荐系统的质量，并作为个性化建议创建新范式的催化剂。印象是一种新颖的数据源，其中包含屏幕上用户显示的项目。过去的研究重点是使用互动提供个性化的建议，并在可用的数据源时有时会使用印象 ...

0 1 0 2025/09/12 arXiv:2308.07857v2 haifengliu

End-to-End Agentic RAG System Training for Traceable Diagnostic Reasoning

知识差距和幻觉阻碍了医学大语言模型的准确诊断。检索和工具增强的方法有助于，但它们的影响受到外部知识的使用和反馈理论不良的可追溯性的限制。为了应对这些挑战，我们介绍了深入DXSearch，这是一种经过训练的端到端训练的辅助学习（RL），以实现TraceBale检索检索效果进行医学诊断 ...

0 0 0 2025/09/12 arXiv:2508.15746v1 takkeri

Modeling Domain and Feedback Transitions for Cross-Domain Sequential Recommendation

如今，许多推荐系统涵盖各个领域，以满足用户的多样化需求，导致用户行为在不同领域之间转换。事实上，不同领域的用户行为揭示了对推荐项目偏好的变化。例如，从负面反馈到正面反馈的转变表明用户满意度有所提高 ...

0 0 0 2025/09/12 arXiv:2408.08209v2 haifengliu

Paragon: Parameter Generation for Controllable Multi-Task Recommendation

商业推荐系统面临着一个挑战，即平台或用户的任务要求经常动态变化（例如，对于准确性或多样性而改变的偏好） ...

0 1 0 2025/09/12 arXiv:2410.10639v2 haifengliu

Future-Conditioned Recommendations with Multi-Objective Controllable Decision Transformer

确保长期成功是推荐系统的最终目标，要求策略能够预见并塑造决策对未来用户满意度的影响。当前的推荐策略与两个重大障碍斗争。首先，推荐决策的未来影响仍然被模糊不清，使通过直接优化直接指标进行评估是不切实际的 ...

0 1 0 2025/09/12 arXiv:2501.07212v1 haifengliu

Combating the Memory Walls: Optimization Pathways for Long-Context Agentic LLM Inference

LLM现在构成了AI代理的骨干，用于各种应用程序，包括工具使用，命令行代理以及Web或计算机使用代理。这些代理LLM推理任务与以聊天机器人为中心的推理有根本不同 - 它们通常具有更大的上下文长度来捕获复杂的，延长的输入，例如整个网页DOMS或复杂的工具呼叫轨迹。反过来，这为推理阶段的基础硬件产生了重要的芯片内存储器流量，并导致工作量受到两个内存墙的约束，即带宽和容量记忆墙，以防止芯片计算单元获 ...

0 0 0 2025/09/12 arXiv:2509.09505v1 jane88

Contrastive learning of Class-agnostic Activation Map for Weakly Supervised Object Localization and Semantic Segmentation

尽管图像分类网络生成的类激活图（CAM）已被广泛用于弱监督的对象定位（WSOL）和语义分割（WSSS），但此类分类器通常集中在区分对象区域上。在本文中，我们提出了仅使用未标记的图像数据的类别不稳定激活图（C $^2 $ AM）生成的对比度学习，而无需参与图像级监督。核心思想来自这样的观察，即i）前景对象的语义信息通常不同于其背景； ii）具有相似外观或背景具有相似颜色/纹理的前景对象在特征空间中具 ...

0 0 0 2025/09/12 arXiv:2203.13505v2 zcr10086

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）