当前基于优化的人类运动的控制技术努力在动态步态步态中同时适应阶梯持续时间和放置,因为它们依赖固定时间离散化,这限制了对地形条件的响应,并在挑战性环境中导致次优性能。在这项工作中,我们提出了一个步态网络的隐式基诺模型预测性控制(MPC),以同时优化自然可变频率运动的步骤位置,步骤持续时间和接触力。所提出的方法结合了步态网络增强的顺序凸MPC算法,以通过迭代性二次程序来求解多线性约束的变量 ...
0 0 0 2025/04/15 arXiv:2502.02934v1 yukun
在图像超分辨率的背景下,对抗性训练非常成功。被证明可以产生现实且高度详细的结果。尽管取得了成功,但许多用于视频超分辨率的最新方法仍然有利于更简单的规范,例如$ L_2 $,而不是对抗损失功能 ...
0 0 0 2025/04/15 arXiv:1811.09393v4 kevinson
在本文中,我们提出了一种用于多模态理解和生成的视觉-音频-语言全感知预训练模型(VALOR)。与广泛研究的视觉语言预训练模型不同,VALOR 以端到端的方式联合建模视觉、音频和语言的关系。它包含三个用于单模态表示的独立编码器,以及一个用于多模态条件文本生成的解码器 ...
0 0 0 2025/04/15 arXiv:2304.08345v2 hynj
大型多模式基础模型(LMM)的快速发展为可能解释的图像质量评估(EIQA)铺平了道路,并从两个角度进行了教学调整:整体质量解释和属性的感知回答。但是,现有的作品通常忽略了这两种类型的感知解释之间的冲突,从而导致理解不足。为了减轻这种情况,我们提出了一个新的范式,用于以感知为导向的指令调整,即 ...
0 0 1 2025/04/15 arXiv:2504.01655v1 15370090936
在图形分类中,基于注意力和基于汇总的图形神经网络(GNN)占上风,从输入图中提取关键特征并支持预测。他们主要遵循学习参加的范式,从而最大程度地提高了所在图和地面标签之间的相互信息。但是,该范式使GNN分类器鲁ck吸收了训练数据中输入特征和标签之间的所有统计相关性,而不会区分特征的因果和非因果关系 ...
0 0 0 2025/04/15 arXiv:2112.15089v2 18045186869
自过去十年以来,具有收缩和扩展路径的全卷积神经网络(fcnn)在大多数医学图像分割应用中表现出了突出的作用。在fcnn中,编码器通过学习全局和局部特征以及上下文表示来发挥不可或缺的作用,这些特征和上下文表示可用于解码器的语义输出预测。尽管取得了成功,但 ...
0 0 0 2025/04/15 arXiv:2103.10504v3 impxxximp
对特征交互进行建模对于点击率 (CTR) 预测至关重要,尤其是在涉及高阶显式交互时。传统方法很难完成这项任务,因为它们经常预先定义最大交互顺序,这在很大程度上依赖于先验知识,并且会限制模型的有效性。此外,对高阶交互进行建模通常会导致计算成本增加 ...
0 0 0 2025/04/15 arXiv:2408.08713v4 18072321722
图像不仅描绘了对象,而且还封装了它们之间的丰富相互作用。但是,产生涉及多个实体相互作用的忠实和高保真图像是一个长期的挑战。虽然在大规模数据集中对预训练的文本到图像模型进行了培训以遵循各种文本说明,但它们很难产生准确的互动,这可能是由于缺乏罕见的训练数据来实现罕见的对象交互 ...
0 0 0 2025/04/15 arXiv:2504.08714v1 qiuyan

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)