AI代理有可能显着改变网络安全局势。为了帮助我们了解这一变化,我们介绍了第一个框架,以捕捉不断发展的现实世界中的进攻和防御性网络障碍。通过BountyBench实例化此框架,我们设置了25个具有复杂,现实世界代码库的系统 ...
0 0 0 2025/06/03 arXiv:2505.15216v1 dm616703
扩散模型具有高级图像样式化,但两个核心挑战仍然存在:(1)在复杂的场景,尤其是身份,构图和细节中保持一致的风格化,以及(2)防止与样式洛拉斯的图像到图像管道中的样式退化。 GPT-4O的出色风格一致性突出了开源方法和专有模型之间的性能差距。为了弥合这一差距,我们提出了\ textbf {omniconistency},这是一个普遍的一致性插件,利用大规模扩散 Transformer (DITS)  ...
0 0 0 2025/06/03 arXiv:2505.18445v1 suxuefeng
(llm)在复杂的推理任务中显示出巨大的潜力,但其性能往往因缺乏高质量且以推理为重点的训练数据集而受到阻碍。为了应对这一挑战,我们提出了关键点驱动数据合成( kpdds),这是一种新颖的数据合成框架,它通过利用来自真实数据源的关键点和示例实践来合成问答对。kpdds通过严格的质量控制和显着的可扩展性确保新颖问题的生成... ...
0 0 0 2025/06/03 arXiv:2403.02333v3 QinNine
多代理辩论(MAD),利用大语言模型(LLMS)之间的协作互动,旨在增强复杂任务中的推理能力。但是,其迭代对话和角色扮演特征的安全含义,尤其是对越狱攻击的敏感性引起有害内容的敏感性,仍然持批判性地持续不断。本文有系统地调查了在领先的商业LLM(GPT-4O,GPT-4,GPT-3,GPT-3)建立的四个著名疯狂框架的越狱漏洞 ...
0 0 0 2025/06/03 arXiv:2504.16489v1 awsszzfff
通常希望在合成数据上训练6D姿势估计系统,因为手动注释很昂贵。但是,由于合成图像和真实图像之间的较大域间隙,合成的颜色图像很昂贵。相反,此域间隙要小得多,更容易填充深度信息 ...
0 0 0 2025/06/03 arXiv:2103.01977v1 hanzhuo
嵌入新闻文章是用于多个领域的关键工具,例如媒体偏见检测,确定假新闻并提出新闻建议。但是,现有的新闻嵌入方法没有优化以捕获新闻事件的潜在上下文。大多数嵌入方法都依赖于全文信息和忽略与时间相关的嵌入生成 ...
0 0 0 2025/06/03 arXiv:2405.13071v2 llleo
我们提出了Pangu ultra,这是一种大型语言模型(LLM),其中有1350亿个参数和在上升神经处理单元(NPU)训练的密集 Transformer 模块。尽管LLM领域在近年来在推动LLM的规模和能力方面一直在见证了前所未有的进步,但培训这样的大规模模型仍然涉及重大优化和系统挑战。为了稳定训练过程,我们提出了深度缩放的三明治归一化,这在深层模型的训练过程中有效消除了损失尖峰 ...
0 0 0 2025/06/03 arXiv:2504.07866v2 hwrabbit
使用扩散模型的视频生成是高度计算密集的,在扩散 Transformer (DIT)模型中,占总计算资源的80 \%以上的3D注意力。在这项工作中,我们引入了{\ bf RainFusion},这是一种新型的无训练稀疏注意方法,利用视觉数据中固有的稀疏性质以加速注意力计算,同时保持视频质量。具体而言,我们在视频生成注意计算中确定了三个独特的稀疏模式 - 空间模式,时间模式和纹理模式 ...
0 0 0 2025/06/03 arXiv:2505.21036v1 Maggie

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)