使用扩散模型的视频生成是高度计算密集的,在扩散 Transformer (DIT)模型中,占总计算资源的80 \%以上的3D注意力。在这项工作中,我们引入了{\ bf RainFusion},这是一种新型的无训练稀疏注意方法,利用视觉数据中固有的稀疏性质以加速注意力计算,同时保持视频质量。具体而言,我们在视频生成注意计算中确定了三个独特的稀疏模式 - 空间模式,时间模式和纹理模式 ...
0 0 0 2025/06/03 arXiv:2505.21036v1 Maggie
互联网正在经历从“网站互联网”到“代理网站”的历史转变。虽然传统网站是信息托管和传播的基础,但新的边境正在出现,在该网站上,代理充当互联网的枢纽,在该互联网中,每个代理人托管一个或多个接收任务,解决这些解决方案并提供可行的解决方案的AI代理,标志着在数字景观中的重大变化,并代表了下一代在线生态系统。在这个愿景下,AI代理操作系统AIOS是AI代理开发,部署和执行的服务器,AI代理是Agentent ...
0 0 0 2025/06/03 arXiv:2504.14411v3 yli
准确地重建路面对于各种应用,尤其是在自动驾驶中都是关键的。本文介绍了编码多层感知器(MLP)框​​架以重建道路表面的位置,其中输入为世界坐标X和Y,并作为高度,颜色和语义信息输出。 The effectiveness of this method is demonstrated through its compatibility with a variety of road height sour ...
0 0 1 2025/06/03 arXiv:2405.10554v2 zhanguanglun
专家(MOE)在大语言模型中的混合物的外科手术有望为更大的模型参数计数和学习能力的执行成本较小,因为每个输入 Token 仅激活一小部分参数。但是,通常观察到,某些专家被激活的频率要比其他专家频率要大得多,从而导致系统效率低时,在并行运行不同设备上的专家时。因此,我们介绍了分组专家(MOGE)的混合物,该混合物在选择过程中对专家进行分组,并在本质上比MOE更好地平衡专家工作量 ...
0 0 2 2025/06/03 arXiv:2505.21411v2 hwrabbit
大型语言模型(LLMS)很容易受到迅速注射攻击的影响,并且最近提出了一些防御措施,通常声称成功地减轻了这些攻击。但是,我们认为现有研究缺乏评估这些防御能力的原则方法。在本文中,我们认为有必要评估两个关键维度的防御措施:(1)对现有和适应性及时的注射攻击的有效性,这些攻击涉及多样化的目标和注射提示,以及(2)通用实用程序,确保辩方不会损害LLM的基础能力 ...
0 0 0 2025/06/03 arXiv:2505.18333v1 dm616703
道路检查对于确保道路维护和交通安全至关重要,因为道路缺陷逐渐出现并妥协道路功能。依靠手动评估的传统方法是劳动密集型,昂贵且耗时的。尽管数据驱动的方法正在受到关注,但在获取高质量数据集时,在现实世界中,道路缺陷的稀缺性和空间稀疏性构成了重大挑战 ...
0 0 0 2025/06/03 arXiv:2412.17699v1 zhanguanglun
尽管现有的检索增强语言模型(RALMS)在提供可靠的来源方面的回应和基础方面取得了重大进展,但他们经常忽略与人类偏好的有效一致性。在对齐过程中,奖励模型(RMS)充当人类价值观指导优化的关键代理。但是,尚不清楚如何评估和选择可靠的RM来进行RALMS中的偏好对齐 ...
0 0 0 2025/06/03 arXiv:2412.13746v1 leec
检索演示的一代(RAG)在知识密集型任务中显示出很大的潜力,但其传统架构依靠静态检索,将其有效性限制在需要顺序寻求信息的复杂问题上。虽然代理推理和搜索提供了一种更自适应的方法,但大多数现有方法都在很大程度上取决于及时工程。在这项工作中,我们介绍了Rag-Gym,这是一个统一的优化框架,在每个搜索步骤中通过细粒度的过程监督增强信息寻求信息 ...
0 0 0 2025/06/03 arXiv:2502.13957v2 ZhangChi

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)