进行操作的学习需要使用能够访问丰富感官信息(例如点云或RGB图像)的策略。点云有效捕获几何结构,使其对于模仿学习中的操纵任务至关重要。相反,RGB图像提供了丰富的纹理和语义信息,对于某些任务至关重要 ...
0 0 0 2025/05/06 arXiv:2502.12320v2 康康23
统一的多模式大语模型(MLLM)旨在通过一个框架整合多模式的理解和发电能力。尽管它们具有多功能性,但现有的开源统一模型仍针对特定领域的体系结构表现出性能差距。为了弥合这一差距,我们提出了Nexus-Gen,这是一个统一的模型,它通过扩散模型的图像合成能力协同LLM的语言推理能力 ...
0 0 0 2025/05/06 arXiv:2504.21356v1 X.K
图像脱毛是图像恢复领域的关键任务,旨在消除模糊的伪影。但是,解决不均匀的模糊的挑战导致了一个不适的问题,这限制了现有脱蓝色模型的概括性能。为了解决问题,我们提出了一个框架SAM-DEBLUR,将任何模型(SAM)的先验知识首次集成到了DeBlurring任务中 ...
0 0 0 2025/05/06 arXiv:2309.02270v2 cwd
无模型深度强化学习(rl)算法已在一系列具有挑战性的决策和控制任务中得到验证。然而,这些方法通常面临两个主要挑战:非常高的样本复杂性和脆弱的收敛特性,这需要细致的超参数调整。这两个挑战都严重限制了此类方法在复杂的现实世界领域的适用性... ...
0 0 0 2025/05/06 arXiv:1801.01290v2 llliuxiao
在驾驶场景中,现实的场景重建由于快速移动的对象带来了重大挑战。大多数现有方法依赖于对象姿势的劳动密集型手动标记来重建规范空间中的动态对象,并根据渲染过程中的这些姿势移动它们。尽管某些方法试图使用3D对象跟踪器替换手动注释,但3D跟踪器的有限概括(由大规模3D数据集的稀缺引起)导致现实世界中的劣质重建 ...
0 0 0 2025/05/06 arXiv:2412.05548v2 zhanguanglun
通过视频监视基于计算机视觉的事故检测已成为一项有益但艰巨的任务。在本文中,提出了用于检测道路事故的新框架。拟议的框架大写在蒙版R-CNN上,以进行准确的对象检测,然后是有效的基于Centroid的对象跟踪算法,用于监视镜头 ...
0 0 0 2025/05/06 arXiv:1911.10037v1 jayllia
随着LLM代理商的更大能力造成伤害,AI开发人员可能越来越依赖于监视等控制措施以证明其安全的合理性。我们素描开发人员如何构建“控制安全案例”,这是一个结构化的论点,即模型无法颠覆控制措施以引起不可接受的结果。作为一个案例研究,我们概述了一个论点,即在AI公司内部部署的假设LLM代理不会剥夺敏感信息 ...
0 0 0 2025/05/06 arXiv:2501.17315v1 leec
随着LLM代理人变得越来越有能力自主造成伤害,AI开发人员将依靠越来越复杂的控制措施来防止可能未对准的药物造成伤害。人工智能开发人员可以通过运行控制评估来证明他们的控制措施足够:测试练习,其中红色团队会产生试图颠覆控制措施的代理。为了确保控制评估准确地捕获未对准的风险,应将授予该红色团队的负担能够适应应在控制措施下部署的代理的能力概况 ...
0 0 0 2025/05/06 arXiv:2504.05259v1 leec

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)