由于其广泛的应用要求,空中对象检测一直是一个热门话题。但是,大多数现有的方法只能处理预定义的类别,这限制了其对现实世界中公开方案的适用性。在本文中,我们通过利用图像和文本之间的关系扩展了空中对象检测到打开场景,并提出了OVA-DRET,这是一种高效的空中图像开放式视频检测器 ...
0 0 0 2025/07/11 arXiv:2408.12246v3 per
最近的一些作品认为,大型语言模型(LLMS)可以通过改善网络威胁智能(CTI)任务的自动化来驯服网络安全领域的数据洪水。这项工作提出了一种评估方法,除了允许在使用零射击学习,几乎没有射击学习和微调的CTI任务上测试LLM之外,还允许量化其一致性和信心水平。我们使用三个最先进的LLM和350个威胁情报报告的数据集进行了实验,并提供了依靠LLMS依靠CTI的潜在安全风险的新证据 ...
0 0 0 2025/07/11 arXiv:2503.23175v1 zhououououou
对于专业艺术家来说,层已成为必不可少的工具,使他们能够建立一个层次结构,从而可以独立控制各个视觉元素。在本文中,我们提出了LayeringDiff,这是一种用于合成分层图像的新型管道,该管道首先使用现成的图像生成模型生成复合图像,然后将图像分解为其组成的前景和背景层。通过从复合图像中提取图层,而不是从头开始生成它们,LayeringDiff绕开了对大规模训练的需求,以开发单个层的生成能力 ...
0 0 0 2025/07/11 arXiv:2501.01197v1 wonglliam
大型生成模型,尤其是基于扩散的方法的最新进展显着增强了图像编辑的功能。但是,实现对图像组成任务的精确控制仍然是一个挑战。允许独立编辑图像组件的分层表示对于用户驱动的内容创建至关重要,但是现有的方法通常很难将图像分解为具有准确保留的透明视觉效果(例如阴影和反射)的合理层 ...
0 0 0 2025/07/11 arXiv:2411.17864v1 wonglliam
社区问题回答(CQA)平台可以被视为社区中的重要知识库,但是在实时利用历史互动和领域知识的有效利用仍然是一个挑战。现有的方法通常不足以外部知识,无法纳入动态的历史质量检查环境,或者缺乏适合工业部署的记忆机制。我们提出了Comrag,这是一个实时工业CQA的检索型生成框架,该框架通过基于质心的存储机制将静态知识与动态历史QA对整合在一起,该机制旨在检索,生成和有效的存储 ...
0 0 0 2025/07/11 arXiv:2506.21098v2 cheeryapp
尽管大型语言模型(LLMS)在许多自然语言处理任务上都表现出色,但它们通常在知识密集型场景中遭受事实不准确。集成外部知识资源,尤其是知识图(KGS),为更可靠的推理提供了透明且可更新的基础。知识基础问题回答(KBQA)是对KGS的查询和原因,这对于这项工作至关重要,尤其是对于复杂的多跳查询而言 ...
0 0 0 2025/07/11 arXiv:2506.01784v2 cheeryapp
在预测多个时间序列中,考虑每个序列的各个特征可能具有挑战性。为了解决这个问题,时间序列分析的现代深度学习方法将共享(全局)模型与本地层相结合,特定于每个时间序列,通常以可学习的嵌入方式实现。理想情况下,这些局部嵌入应编码每个序列独特动力学的有意义表示 ...
0 0 0 2025/07/11 arXiv:2410.14630v2 faceboy
Parkour为腿部机器人提供了一项高度挑战的任务,要求他们以敏捷和光滑的运动穿越各种地形。尽管机器人感知和驱动是固有的不可靠性,但这需要对机器人自己的状态和周围地形的全面理解。当前的最新方法要么依赖于复杂的预训练的高级地形重建模块,要么限制机器人跑酷的最大潜力,以避免由于不准确的感知而导致的失败 ...
0 0 0 2025/07/11 arXiv:2408.13740v3 xiewende

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)