在每个卷积层中学习一个静态卷积内核是现代卷积神经网络(CNN)的常见训练范式。取而代之的是,动态卷积的最新研究表明,学习$ n $卷积内核与输入依赖性注意力的线性组合可以显着提高轻重量CNN的准确性,同时保持有效的推断。但是,我们观察到,现有的作品endow卷积内核具有通过一个维度(关于卷积内核编号)的动态属性的内核空间,但是其他三个维度(关于每个卷积内核的空间大小,输入通道号和输出通道号) .. ...
0 0 0 2025/06/20 arXiv:2209.07947v1 尼斯湖
建议的问题(SQS)为用户提供了有效的初始接口,以便在AI驱动的阅读应用程序中与其文档互动。在实践阅读会议中,用户具有不同的背景和阅读目标,但是当前的SQ功能通常忽略了此类用户信息,从而导致均质或无效的问题。我们介绍了一条管道,该管道通过将读取器概况(专业和阅读目标)结合起来,并以两种方式演示其实用性:1)作为改进的SQ生成管道,与当前的基准相比,与当前的基准相比,产生更高的质量和更多样化的问题, ...
0 0 0 2025/06/20 arXiv:2412.12445v2 cheeryapp
检索增强的一代(RAG)对于大规模代码生成至关重要,基于外部代码语料库的预测以改善现实性。但是,抹布管道的一个关键但毫无疑问的方面是块 - 将文档分为可检索的单元的过程。现有的基于线的块启发式方法通常会破坏语义结构,分裂功能或合并无关的代码,从而降低发电质量 ...
0 0 0 2025/06/20 arXiv:2506.15655v1 yanxi
基于规则的奖励提供了一种有前途的策略来改善从人类反馈(RLHF)中学习的强化学习,但是当前的方法通常依赖于手动规则工程。我们提出自动化,这是一种完全自动化的方法,用于从偏好反馈中提取规则并将其提出为基于规则的奖励。自动提取分为三个阶段:它利用推理模型来解释用户偏好,从这些解释的推理链中识别候选规则,并将其合成为统一规则集 ...
0 0 0 2025/06/20 arXiv:2506.15651v1 Barca
在这项工作中,我们提出了一个沿现代Hopfield网络(MNH)线的能量功能,其固定点与由于Vaswani等人[12]引起的注意力相对应,从而统一了两个框架。该景观的最小值形成了“上下文井”  - 稳定的配置,封装了 Token 之间的上下文关系 ...
0 0 0 2025/06/20 arXiv:2506.11043v1 odenkkk
从车内摄像机捕获的拥挤观察中揭示一条空旷的街道对于自动驾驶至关重要。但是,删除所有暂时的静态物体,例如停止的车辆和站立行人,提出了重大挑战。与以对象为中心的3D插入式介绍不同,这依赖于在一个小场景中进行详尽的观察,街道场景案例涉及与以前3D授课任务不同的长轨迹 ...
0 0 0 2025/06/20 arXiv:2405.18416v4 zhanguanglun
随着视觉模型(VLM)的不断增长,移动代理现在被广泛用于UI自动化和基于相机的用户帮助等任务。这些代理通常会在有限的用户生成的数据集上进行微调,使它们在培训过程中容易受到秘密威胁的影响。在这项工作中,我们提出了Ghost,这是第一次专为基于VLMS的移动代理而设计的清洁标签后门攻击 ...
0 0 0 2025/06/20 arXiv:2506.13205v1 hhhhh
鉴于由于计算限制,对所有候选人的微调不切实际,开源大型语言模型(LLM)和多样化的下游任务的扩散需要有效的模型选择。尽管LLM选择最近取得了进步,但基本的研究问题基本上仍然是新生的:我们如何在微调过程中对LLM的动态行为进行建模,从而增强我们对它们在各种下游任务中的概括性能的理解?在这项工作中,我们提出了一个新颖的理论框架,该框架提供了适当的镜头来评估LLM的概括能力,从而为下游应用提供了准确有效 ...
0 0 0 2025/06/20 arXiv:2505.03793v3 瓶子

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)