当前的语言模型培训范例通常会在达到末端(<EOS>) Token 后终止学习,从而忽略了完成后空间中潜在的学习机会。我们提出了完成后学习(PCL),这是一个新型的培训框架,该培训框架在模型完成后系统地利用了序列空间,以增强推理和自我评估能力。 PCL使模型能够继续产生自我评估并在培训期间进行奖励预测,同时通过在完成点停止来保持有效的推断 ...
0 0 0 2025/09/12 arXiv:2507.20252v3 15503197195
生成人工智能(AI)的最新进展,尤其是大型语言模型(LLMS)的整合,对多个领域产生了很大影响。同时,增强动态网络性能是促进技术进步并满足许多涉及网络应用领域的用户需求不断增长的需求的关键因素。在本文中,我们探讨了动态网络中LLM和图的集成,重点关注潜在的应用和实际研究 ...
0 0 0 2025/09/12 arXiv:2407.20840v1 s_75san
医疗图像检索对于依靠判别性视觉表示,对于临床决策和翻译研究至关重要。然而,目前的方法仍然分散,依靠2D,3D和基于视频的医疗数据的单独架构和培训策略。这种特定于模式的设计会阻碍可扩展性并抑制统一表示形式的发展 ...
0 0 0 2025/09/12 arXiv:2509.01360v1 1939058274
建立一个可以模仿人类行为模式以完成各种开放世界任务的代理是一个长期目标。为了使代理商能够有效地学习各种任务的行为模式,关键的挑战在于建模观察,行动和语言之间的复杂关系。为此,我们提出了一种新型的Minecraft代理Optimus-2,该代理将用于高级计划的多模式大语模型(MLLM)以及一个用于低水平控制的目标观察行动条件策略(GOAP) ...
0 0 0 2025/09/12 arXiv:2502.19902v2 liwenbo
最近的研究表明,通过利用预审前视觉和语言模型(VLMS)的伪标签(PLS)(VLMS),开放式摄物对象检测(OVD)的表现有希望。但是,很少探索OVD的师生自我训练,这是一种强大而广泛使用的范式来利用PLS。这项工作确定了在OVD中使用自我训练的两个挑战:来自VLM的嘈杂PL和PL的频繁分布变化 ...
0 0 0 2025/09/12 arXiv:2308.06412v3 120001098
在过去的十年中,在视频任务的自我监督学习方面取得了显着的成就。最近的努力通常采用蒙版视频建模(MVM)范式,从而在多个视频任务上取得了重大进展。但是,仍然存在两个关键挑战:1)如果没有人类注释,随机的时间抽样会引入不确定性,从而增加了模型训练的难度 ...
0 0 0 2025/09/12 arXiv:2503.15096v1 1939058274
这项研究通过区分两个LLM评估范式来调查有关指示符(形式)的语言模型(LLM)的语言理解(LLM):心理语言和神经语言学。传统的心理语言评估通常反映出可能无法准确代表LLMS真正语言能力的统计规则。我们采用了一种新方法,它引入了一种神经语言方法,该方法结合了最小对和诊断探测,以分析模型层的激活模式 ...
0 0 0 2025/09/12 arXiv:2411.07533v3 18835379548
语言模型的快速改善增加了滥用文本生成系统的幽灵。这一进步促使开发简单的方法用于检测可以使用并解释为非专家的生成文本。我们开发了GLTR,这是一种支持人类检测文本是否由模型生成的工具 ...
0 0 0 2025/09/12 arXiv:1906.04043v1 15966829631

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)