强大的用户表示形式的开发是推荐系统成功(RECSYS)成功的关键因素。在线平台采用一系列Recsys技术来个性化各种应用程序内表面的用户体验。通常通过用户在每个表面中的历史互动来分别学习用户表示,并且可以在事后以辅助功能或其他检索源共享用户表示 ...
0 0 0 2025/05/06 arXiv:2504.21838v1 AmyLYJ
大型语言模型 (LLM) 的快速发展导致人们纷纷努力将其能力扩展到多模式任务。其中,越来越多的注意力集中在将视觉编码和语言解码集成到单个 LLM 中的整体多模态大型语言模型 (MLLM)。尽管结构简单且部署友好,但训练具有良好性能的整体 MLLM 仍然具有挑战性 ...
0 0 0 2025/05/06 arXiv:2410.08202v3 18832252926
传统上,人类运动模型将运动产生和估计分为具有专门模型的不同任务。运动生产模型着重于从文本,音频或钥匙帧等输入中创建多样化的现实动作,而运动估计模型旨在从视频等观察结果中重建准确的运动轨迹。尽管共享时间动力学和运动学的基本表示,但这种分离限制了任务之间的知识转移,并且需要维护单独的模型 ...
0 0 0 2025/05/06 arXiv:2505.01425v1 qinhui_cici
文本指导的图像编辑是一项必不可少的任务,使用户能够通过自然语言描述修改图像。扩散模型和整流流的最新进展已显着提高了编辑质量,主要依赖于反转技术来从输入图像中提取结构化噪声。但是,反转的不准确性会传播错误,从而导致意外的修改并损害忠诚度 ...
0 0 0 2025/05/06 arXiv:2503.23897v1 wangteqi
无模型的深钢筋学习(RL)算法已成功应用于一系列具有挑战性的顺序决策和控制任务。但是,这些方法通常面临两个主要挑战:高样本复杂性和对超参数的脆性。这两个挑战都限制了此类方法对现实世界的适用性 ...
0 0 52 2025/05/06 arXiv:1812.05905v2 iheiyumao
人类运动本质上是连续和动态的,对生成模型构成了重大挑战。尽管广泛使用离散的生成方法,但它们的表现力和框架噪声伪像有限。相比之下,连续的方法会产生更光滑,更自然的运动,但由于高维复杂性和有限的训练数据而往往很难遵守调理信号 ...
0 0 0 2025/05/06 arXiv:2411.19527v3 qinhui_cici
解决部分微分方程的机器学习方法需要在功能空间之间学习映射。尽管卷积或图神经网络被限制在离散功能上,但神经操作员为直接映射功能提供了有希望的里程碑。尽管结果令人印象深刻,他们仍然在域几何形状方面面临挑战,并且通常依靠某种形式的离散化 ...
0 0 0 2025/05/06 arXiv:2306.07266v2 wgkooo

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)