lllianghe的文档

lllianghe

个性签名 ...

It's All About Your Sketch: Democratising Sketch Control in Diffusion Models

本文揭开了扩散模型的草图潜力，解决了生成AI中直接草图控制的欺骗性希望。我们重要的是将过程民主化，使业余素描能够产生精确的图像，并符合“您的素描就是您得到的东西”的承诺。一项试点研究强调了必要性，揭示了现有模型中的畸形源于空间条件 ...

0 0 0 0 2025/04/01 arXiv:2403.07234v2 lllianghe

DemoCaricature: Democratising Caricature Generation with a Rough Sketch

在本文中，我们将讽刺漫画的一代民主化，使个人能够用照片和概念素描轻松地制作个性化的漫画。我们的目标是在抽象和身份之间取得微妙的平衡，同时保留草图中固有的创造力和主观性。为了实现这一目标，我们将与单像个性化同时提出明确的Rank-1模型编辑，从而选择性地将细微的编辑应用于跨注意层，以实现认同和样式的无缝合并 ...

0 0 0 0 2025/04/01 arXiv:2312.04364v2 lllianghe

Picture that Sketch: Photorealistic Image Generation from Abstract Sketches

鉴于像您和我这样的未经训练的业余爱好者的抽象，变形，普通的草图，本文将其变成了逼真的图像 - 就像图1（a）所示的那些未挑选的图1（a）所示。我们与先前的艺术有很大差异，因为我们不决定要开始使用类似Edgemap的草图，而是要使用抽象的自由人类草图 ...

0 0 0 0 2025/03/25 arXiv:2303.11162v2 lllianghe

All in One Framework for Multimodal Re-identification in the Wild

在重新识别（REID）中，最近的进步在单峰和跨模式检索任务中都取得了值得注意的进步。但是，挑战一直在开发一个统一的框架上，该框架可以有效地处理不同的多模式数据，包括RGB，红外线，草图和文本信息。此外，大规模模型的出现在各种视觉任务中显示出令人鼓舞的表现，但是里德的基础模型仍然空白 ...

0 0 0 0 2025/03/25 arXiv:2405.04741v1 lllianghe

StyleMeUp: Towards Style-Agnostic Sketch-Based Image Retrieval

基于草图的图像检索（SBIR）是一个跨模式匹配问题，通常通过学习一个关节嵌入空间来解决，其中保留了照片和草图模式之间共享的语义内容。但是，到目前为止，SBIR中的一个基本挑战在很大程度上被忽略了，也就是说，草图是由人类提出的，并且不同用户之间存在相当大的样式变化。一个有效的SBIR模型需要明确说明这种样式多样性，以概括为看不见的用户样式 ...

0 0 0 0 2025/03/06 arXiv:2103.15706v2 lllianghe

Adversarial Open Domain Adaptation for Sketch-to-Photo Synthesis

在本文中，我们探索开放域草图到照片的转换，其目的是从带有类标签的手绘草图合成逼真的照片，即使训练数据中缺少该类的草图。由于缺乏训练监督以及手绘草图和照片域之间存在较大的几何失真，这是一项具有挑战性的工作。为了合成照片中缺少的手绘草图，我们提出了一个共同学习草图到照片和照片到草图生成的框架 ...

0 0 0 0 2025/01/18 arXiv:2104.05703v2 lllianghe

RGB-Infrared Cross-Modality Person Re-Identification via Joint Pixel and Feature Alignment

由于 RGB 和 IR 图像之间存在较大的跨模态变化，RGB 红外 (IR) 人员重新识别是一项重要且具有挑战性的任务。大多数传统方法旨在通过特征表示学习来弥合特征对齐的跨模态差距。与现有方法不同，在本文中，我们针对 RGB-IR RE-ID 任务提出了一种新颖的端到端对齐生成对抗网络（AlignGAN） ...

0 0 0 0 2025/01/17 arXiv:1910.05839v2 lllianghe

CLIP for All Things Zero-Shot Sketch-Based Image Retrieval, Fine-Grained or Not

在本文中，我们利用 CLIP 进行基于零样本草图的图像检索（ZS-SBIR）。我们很大程度上受到了基础模型的最新进展以及它们似乎提供的无与伦比的泛化能力的启发，但这是第一次对其进行定制以使草图社区受益。我们针对如何最好地实现这种协同作用，针对类别设置和细粒度设置（“全部”）提出了新颖的设计 ...

0 0 0 0 2025/01/15 arXiv:2303.13440v3 lllianghe

Deep Learning for Person Re-identification: A Survey and Outlook

人员重新识别（Re-ID）旨在跨多个不重叠的摄像机检索感兴趣的人。随着深度神经网络的进步和智能视频监控需求的不断增加，计算机视觉界对它的兴趣显着增加。通过剖析开发人员重识别系统所涉及的组件，我们将其分为封闭世界和开放世界设置 ...

0 0 0 0 2025/01/15 arXiv:2001.04193v2 lllianghe

Learning by Aligning: Visible-Infrared Person Re-identification using Cross-Modal Correspondences

我们解决可见光-红外人重新识别（VI-reID）的问题，即在跨模式设置中检索由可见光或红外相机捕获的一组人图像。 VI-reID 的两个主要挑战是人员图像的类内差异以及可见光和红外图像之间的跨模式差异。假设人物图像大致对齐，以前的方法试图学习粗略的图像或刚性的部分级人物表示，这些表示在不同的模态中具有区分性和可概括性 ...

0 0 0 0 2025/01/12 arXiv:2108.07422v1 lllianghe