场景图捕获了对象之间的复杂关系,作为内容生成和操纵的强大先验。然而,无论是添加节点还是修改边缘,合理地操纵场景图 - 仍然是一项具有挑战性且没有触及的任务。诸如将节点添加到图形或有关节点与所有其他关系的关系的推理之类的任务在计算上是棘手的,因为即使是单个边缘修改也可能触发冲突,因为图形中的复杂相互依赖性 ...
0 0 0 2025/04/14 arXiv:2503.18988v1 蔡明方
LLM在某些安全任务和CTF挑战中表现出了初步的承诺。但是,目前尚不清楚LLM是否能够实现多阶段网络攻击,这涉及在多个主机上执行各种动作,例如进行侦察,利用漏洞来获得初始访问,利用内部主机横向移动,并使用多个损害的主机来驱逐数据。我们评估了10个多阶段网络的LLM,发现流行的LLM无法实现这些攻击 ...
0 0 0 2025/04/14 arXiv:2501.16466v2 OrganicWater
大型语言模型(LLM)代理人越来越能够自主进行网络攻击,对现有应用构成了重大威胁。这种日益增长的风险凸显了迫切需要进行现实世界中的基准评估LLM代理利用Web应用程序漏洞的能力。但是,现有的基准缺乏,因为它们仅限于抽象的捕获国旗竞赛或缺乏全面的覆盖范围 ...
0 0 0 2025/04/14 arXiv:2503.17332v2 OrganicWater
SGD在 Transformer 上的显着余量比亚当的表现要差,但原因尚不清楚。在这项工作中,我们通过Hessian的镜头提供了一种解释:(i) Transformer 是“异质性”:参数块跨参数块的Hessian频谱差异很大,我们称之为“块异质性”的现象; (ii)异质性HAMPERS SGD:SGD在块异质性问题上的表现要比Adam差。为了验证(i)和(ii),我们检查了各种 Transfor ...
0 0 0 2025/04/14 arXiv:2402.16788v4 IQ_QI
自主驾驶评估需要密切复制实际道路状况的模拟环境,包括现实世界的感觉数据和反应反馈循环。但是,许多现有的模拟需要预测公共数据集或综合影像学数据上的固定路线,\ ie,开环模拟通常缺乏评估动态决策的能力。尽管闭环模拟的最新努力提供了反馈驱动的环境,但它们无法处理视觉传感器输入或产生与现实数据不同的输出 ...
0 0 0 2025/04/14 arXiv:2411.11252v1 k9354465
从演示中学习已显示是一种有效的机器人操作方法,尤其是在最近收集的带有远程操作系统的大规模机器人数据的方法中。在不同的机器人平台上建立有效的远程操作系统已经比以往任何时候都变得更加重要。但是,对于不同的最终效果,e ...
0 0 0 2025/04/13 arXiv:2408.11805v1 fazai001
已证明,在线性顺序上以弹性互动为特征的宇宙学模型已被证明为减轻$ \ sigma_8 $张力提供了有希望的方案。在这些情况下,一个自然的问题是,相互作用和大规模中微子之间是否可能存在堕落,这也有助于彻底消除结构。在这项工作中,我们研究了这种堕落的存在,并表明这两种效应没有显示很强的相关性 ...
0 0 0 2025/04/13 arXiv:2403.03216v1 wsy__
我们介绍了Orb,这是材料原子建模的普遍原子间潜力家族。 ORB模型的速度比现有通用电位快3-6倍,在模拟下,对于一系列分配材料的模拟稳定,并且在释放后,与MATBENCH DISCOVER DISCOUDY基准测试的其他方法相比,误差降低了31%。我们探索了材料基础模型开发的几个方面,重点是预处理 ...
0 0 0 2025/04/13 arXiv:2410.22570v1 ZeHeru

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)