生成模型在多元时间序列预测(MT)中引起了人们的重大关注,特别是由于它们产生高保真样本的能力。预测多元时间序列的概率分布是一项具有挑战性但实用的任务。尽管最近尝试处理这项任务,但两个主要挑战仍然存在:1)在高维多元时间序列序列中,一些现有的生成方法的表现不佳预测,这很难扩展到更高的维度; 2)固有的高维多元属性限制了现有生成模型的预测长度 ...
0 0 0 2025/06/07 arXiv:2502.08302v1 zzy15280
人类通过多感觉整合来感知世界,将不同方式的信息融合以适应其行为。对比学习为多模式自学学习提供了一种吸引人的解决方案。的确,通过将每种模式视为同一实体的不同观点,它可以学会在共享表示空间中与不同模态的特征保持一致 ...
0 0 0 2025/06/07 arXiv:2409.07402v2 Hahhhnxsm
本文通过促进视频级视觉语言对齐来研究参考视频对象分割( rvos)。最近的方法将rvos任务建模为序列预测问题,并分别执行多模态交互以及每个帧的分割。然而,缺乏视频内容的全局视图导致难以有效利用帧间关系和理解对象时间变化的文本描述... ...
0 0 0 2025/06/07 arXiv:2305.17011v1 ajsaj
随着多模式大语言模型(MLLM)的快速发展,它们越来越多地部署为能够完成复杂计算机任务的自动计算机使用代理。但是,出现了一个紧迫的问题:在对话方案中为一般MLLM设计和对齐的安全风险原则是否可以有效地转移到现实世界中的计算机使用方案中?现有关于评估基于MLLM的计算机使用代理的安全风险的研究遭受了几个局限性:它缺乏现实的交互式环境,或者狭义地关注一种或几种特定的风险类型。这些局限性忽略了现实环境的 ...
0 0 0 2025/06/07 arXiv:2506.00618v2 hhhhh
在这项工作中,我们研究了离线增强学习(RL)算法的可伸缩性。原则上,真正可扩展的离线RL算法应该能够解决任何给定的问题,无论其复杂性如何,给定足够的数据,计算和模型容量。我们使用比典型的离线RL数据集大的数据集对当前的离线RL算法与当前的离线RL算法是否符合这一诺言 ...
0 0 0 2025/06/07 arXiv:2506.04168v1 晚餐杀手
最近,人们对使用大语言模型(LLM)进行科学研究的兴趣越来越大。已经提出了许多基准,以评估LLM的科学研究能力。但是,当前的基准主要基于预先收集的客观问题 ...
0 0 0 2025/06/07 arXiv:2308.13149v2 18743622602
 Transformer 在处理计算机视觉任务方面取得了长足的进步。然而,现有的视觉转换器尚不具备在不同尺度的特征之间建立交互的能力,这对于视觉输入来说在感知上很重要。原因有两个:(:(,因此无法提取跨尺度的特征;,因此无法提取跨尺度的特征;2)为了降低计算成本 ...
0 0 0 2025/06/07 arXiv:2108.00154v2 男神
我们考虑图形链接预测任务,这是许多现实世界应用程序的经典图分析问题。随着深度学习的进步,当前的链接预测方法通常从以两个相邻节点为中心的子图中计算特征,并使用这些功能来预测这两个节点之间的链接标签。在这种形式主义中,链接预测问题将转换为图形分类任务 ...
0 0 0 2025/06/07 arXiv:2010.10046v1 xixiaixixi

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)