在本文中,我们探索开放域草图到照片的转换,其目的是从带有类标签的手绘草图合成逼真的照片,即使训练数据中缺少该类的草图。由于缺乏训练监督以及手绘草图和照片域之间存在较大的几何失真,这是一项具有挑战性的工作。为了合成照片中缺少的手绘草图,我们提出了一个共同学习草图到照片和照片到草图生成的框架 ...

0 0 0 0 2025/01/18 arXiv:2104.05703v2 lllianghe

由于 RGB 和 IR 图像之间存在较大的跨模态变化,RGB 红外 (IR) 人员重新识别是一项重要且具有挑战性的任务。大多数传统方法旨在通过特征表示学习来弥合特征对齐的跨模态差距。与现有方法不同,在本文中,我们针对 RGB-IR RE-ID 任务提出了一种新颖的端到端对齐生成对抗网络(AlignGAN) ...

0 0 0 0 2025/01/17 arXiv:1910.05839v2 lllianghe

在本文中,我们利用 CLIP 进行基于零样本草图的图像检索(ZS-SBIR)。我们很大程度上受到了基础模型的最新进展以及它们似乎提供的无与伦比的泛化能力的启发,但这是第一次对其进行定制以使草图社区受益。我们针对如何最好地实现这种协同作用,针对类别设置和细粒度设置(“全部”)提出了新颖的设计 ...

0 0 0 0 2025/01/15 arXiv:2303.13440v3 lllianghe

人员重新识别(Re-ID)旨在跨多个不重叠的摄像机检索感兴趣的人。随着深度神经网络的进步和智能视频监控需求的不断增加,计算机视觉界对它的兴趣显着增加。通过剖析开发人员重识别系统所涉及的组件,我们将其分为封闭世界和开放世界设置 ...

0 0 0 0 2025/01/15 arXiv:2001.04193v2 lllianghe

我们解决可见光-红外人重新识别(VI-reID)的问题,即在跨模式设置中检索由可见光或红外相机捕获的一组人图像。 VI-reID 的两个主要挑战是人员图像的类内差异以及可见光和红外图像之间的跨模式差异。假设人物图像大致对齐,以前的方法试图学习粗略的图像或刚性的部分级人物表示,这些表示在不同的模态中具有区分性和可概括性 ...

0 0 0 0 2025/01/12 arXiv:2108.07422v1 lllianghe

人员重新识别(re-ID)需要密集分布的摄像头。在实践中,感兴趣的人可能不会被相机捕捉到,因此需要使用主观信息(例如, ...

0 0 0 0 2025/01/09 arXiv:2309.08372v1 lllianghe

对象重新识别(Re-ID)旨在识别不同时间和场景的特定对象,这是计算机视觉领域广泛研究的任务。长期以来,该领域主要由基于卷积神经网络的深度学习技术驱动。近年来,Vision Transformers的出现促使越来越多的研究深入研究基于Transformer的Re-ID,不断打破性能记录,见证了Re-ID领域的重大进展 ...

0 1 0 0 2025/01/09 arXiv:2401.06960v2 lllianghe

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)