多场景多任务学习已广泛应用于工业应用中的许多推荐系统中,其中一种有效且实用的方法是基于Mixture-of-Expert(MoE)架构进行多场景迁移学习。然而,基于MoE的方法旨在将所有信息投影在同一特征空间中,无法有效处理各种场景和任务之间固有的复杂关系,导致性能不理想。为了解决这个问题,我们提出了一种用于多场景和多任务推荐的分层信息提取网络(HiNet),它实现了基于从粗到精的知识转移方案的分 ...
0 0 0 2025/05/13 arXiv:2303.06095v3 Leeyhom
大型语言模型(LLM)的最新进展激发了人们对建立完全自主的代理商的兴趣。但是,完全自主的LLM代理仍然面临重大挑战,包括由于幻觉而导致的可靠性有限,难以处理复杂的任务以及实质性的安全性和道德风险,所有这些都限制了他们在现实应用程序中的可行性和可信度。为了克服这些局限性,基于LLM的人类代理系统(LLM-HAS)将人提供的信息,反馈或控制纳入代理系统中,以增强系统性能,可靠性和安全性 ...
0 0 0 2025/05/13 arXiv:2505.00753v1 leec
在优化顺序推荐任务中的长期用户参与时,强化学习 (RL) 算法受到越来越多的关注。大规模在线推荐系统面临的挑战之一是用户行为模式的持续而复杂的变化,例如交互率和保留倾向。当将其表述为马尔可夫决策过程(MDP)时,推荐系统的动态和奖励函数会不断受到这些变化的影响 ...
0 0 0 2025/05/13 arXiv:2310.03984v3 qf_ml
在本文中,我们介绍了 DiarizationLM,这是一个利用大型语言模型 (LLM) 对说话者二值化系统的输出进行后处理的框架。使用所提出的框架可以实现各种目标,例如提高分类记录的可读性,或降低单词分类错误率(WDER)。在此框架中,自动语音识别(ASR)和说话人分类系统的输出表示为紧凑的文本格式,该格式包含在可选微调的 LLM 的提示中 ...
0 0 0 2025/05/13 arXiv:2401.03506v11 leosurre
虽然最近基于图像的人类动画方法实现了现实的身体和面部运动综合,但临界差距仍保持精细的整体可控性,多尺度适应性和长期的时间连贯性,从而导致其较低的表现力和稳健性。我们提出了一个基于扩散 Transformer (DIT)的框架Dreamactor-M1,并通过混合指导来克服这些限制。为了进行运动引导,我们的混合控制信号集成了隐式面部表示,3D头部球和3D身体骨架,可实现对面部表情和身体运动的强大控制 ...
0 0 0 2025/05/13 arXiv:2504.01724v3 JyEeee
知识图(kg)归纳推理旨在推断培训期间未见的新kg的缺失事实,在各种应用中已被广泛采用。 KG归纳推理的一个关键挑战是在文本和结构方面处理低资源场景,均缺乏。在本文中,我们试图通过大型语言模型(LLM)来应对这一挑战 ...
0 0 0 2025/05/13 arXiv:2402.11804v3 aulisa
在药物发现中,使用昂贵的湿lab实验确认计算模型的药物特性的预测至关重要。因此,获得可靠的不确定性估计值对于对随后的实验验证的优先级排序至关重要。共形预测(CP)是为具有覆盖范围保证的分子特性创建这样的预测集的有前途的工具 ...
0 0 0 2025/05/13 arXiv:2310.12033v1 younglight25
由于缺乏将音频信号与以推理为导向的文本分析相结合的高质量多模式训练数据,因此对电信欺诈的检测面临重大挑战。为了解决这一差距,我们提出了Teleantifraud-28K,这是第一个专门为自动电信欺诈分析设计的开源音频 - 文本慢思维数据集。我们的数据集是通过三种策略来构建的:(1)使用自动语音识别(ASR)转录的呼叫记录(带有匿名的原始音频)的隐私文本真实示例生成,从而确保通过文本对语音(TTS) ...
0 0 0 2025/05/13 arXiv:2503.24115v3 kbwzy

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)