在本文中,我们探索开放域草图到照片的转换,其目的是从带有类标签的手绘草图合成逼真的照片,即使训练数据中缺少该类的草图。由于缺乏训练监督以及手绘草图和照片域之间存在较大的几何失真,这是一项具有挑战性的工作。为了合成照片中缺少的手绘草图,我们提出了一个共同学习草图到照片和照片到草图生成的框架 ...
由于 RGB 和 IR 图像之间存在较大的跨模态变化,RGB 红外 (IR) 人员重新识别是一项重要且具有挑战性的任务。大多数传统方法旨在通过特征表示学习来弥合特征对齐的跨模态差距。与现有方法不同,在本文中,我们针对 RGB-IR RE-ID 任务提出了一种新颖的端到端对齐生成对抗网络(AlignGAN) ...
在本文中,我们利用 CLIP 进行基于零样本草图的图像检索(ZS-SBIR)。我们很大程度上受到了基础模型的最新进展以及它们似乎提供的无与伦比的泛化能力的启发,但这是第一次对其进行定制以使草图社区受益。我们针对如何最好地实现这种协同作用,针对类别设置和细粒度设置(“全部”)提出了新颖的设计 ...
人员重新识别(Re-ID)旨在跨多个不重叠的摄像机检索感兴趣的人。随着深度神经网络的进步和智能视频监控需求的不断增加,计算机视觉界对它的兴趣显着增加。通过剖析开发人员重识别系统所涉及的组件,我们将其分为封闭世界和开放世界设置 ...
我们解决可见光-红外人重新识别(VI-reID)的问题,即在跨模式设置中检索由可见光或红外相机捕获的一组人图像。 VI-reID 的两个主要挑战是人员图像的类内差异以及可见光和红外图像之间的跨模式差异。假设人物图像大致对齐,以前的方法试图学习粗略的图像或刚性的部分级人物表示,这些表示在不同的模态中具有区分性和可概括性 ...
人员重新识别(re-ID)需要密集分布的摄像头。在实践中,感兴趣的人可能不会被相机捕捉到,因此需要使用主观信息(例如, ...
对象重新识别(Re-ID)旨在识别不同时间和场景的特定对象,这是计算机视觉领域广泛研究的任务。长期以来,该领域主要由基于卷积神经网络的深度学习技术驱动。近年来,Vision Transformers的出现促使越来越多的研究深入研究基于Transformer的Re-ID,不断打破性能记录,见证了Re-ID领域的重大进展 ...