在本文中,我们利用涉及视觉和语言互动的人类感知过程来生成对未修剪视频的连贯段落描述。我们提出了视觉语言(VL)特征,这些特征由两种模式组成,即 ...
大型语言模型(LLMS)越来越多地用作分类与不同域相关的文本并同时进行几个标签(类)分类的骨干。遇到域移动时,例如 ...
域的适应性旨在使大型语言模型(LLMS)在训练阶段有效地概括域数据集。但是,诸如模型参数的大小和训练数据的规模之类的因素是一般影响者,并且不能反映域适应性绩效的细微差别。本文研究了影响域适应性绩效的细粒因素,分析了“单词”在培训数据中对摘要任务的特定影响 ...
顺序推荐(SR)任务涉及根据用户过去的交互来预测用户可能与之交互的下一个项目。 SR 模型检查用户操作的顺序,以识别更复杂的行为模式和时间动态。最近的研究证明了 LLM 对顺序推荐系统的巨大影响,无论是将顺序推荐视为语言建模还是作为用户表示的支柱 ...
大型语言模型(LLM)的生成建议取得了显着的成功,但其实际部署却是昂贵的,尤其是由于自回归解码引起的推理延迟过多。对于无损耗的LLM解码加速度,投机解码(SD)已成为有前途的解决方案。但是,由于需要生成TOP-K项目,因此将SD应用于生成建议提出了独特的挑战(i ...
尽管大语言模型(LLMS)取得了重大进步,但推理模型的主要缺点是它们的巨大 Token 用法,从而增加了计算成本,资源需求和响应时间。在这项工作中,我们重新审视了增强学习的核心原则(RL),并通过数学分析表明,产生冗长响应的趋势本质上是源于训练过程中基于RL的优化。这一发现质疑了较长响应固有地提高推理准确性的普遍假设 ...
许多现实世界的优化方案涉及昂贵的评估,其成本未知和异质成本。成本吸引的贝叶斯优化是应对这些挑战的重要解决方案。为了以具有成本效益的方式在有限预算内接近全球最佳,成本感知收购功能(AFS)的设计成为关键步骤 ...
由于4D磁共振成像(MRI)在识别心血管疾病中的血液动力学方面的准确性有限,因此获得患者特异性流动边界条件的挑战以及计算苛刻的计算流体动力学(CFD)模拟的计算苛刻和时间耗时的性质,因此可以探索这些新数据的限制,以探索这些新数据的限制。在目前的工作中,我们在3D腹部主动脉瘤(AAA)理想的模型中研究了物理知识的神经网络(PINN),深接操作员网络(PINN)及其物理信息扩展(PI-Deeponet ...