图像抠图是指从自然图像中提取精确的阿尔法遮罩,它在图像编辑等各种下游应用中发挥着至关重要的作用。尽管这是一个不适定问题,但传统方法几十年来一直在尝试解决它。深度学习的出现彻底改变了图像抠图领域,并催生了多种新技术,包括自动、交互式和参考图像抠图 ...

0 0 0 0 2024/04/10 arXiv:2304.04672v1 爱吃鱼的两包盐

视频抠图旨在预测给定输入视频序列中每一帧的 alpha 遮罩。过去几年,视频抠图的解决方案一直以深度卷积神经网络(CNN)为主,它已成为学术界和工业界事实上的标准。然而,由于基于 CNN 的架构,它们具有内置的局部归纳偏差,并且无法捕获图像的全局特征 ...

0 0 0 0 2024/04/09 arXiv:2208.12801v2 爱吃鱼的两包盐

最近的研究通过将基于 Trimap 的图像抠图的成功扩展到视频领域,在视频抠图方面取得了巨大进展。在本文中,我们将此任务推向更实用的设置,并提出了单三图视频抠图网络(OTVM),该网络仅使用一个用户注释的三图来稳健地执行视频抠图。 OTVM 的关键是三图传播和 alpha 预测的联合建模 ...

0 0 0 0 2024/04/09 arXiv:2207.13353v1 爱吃鱼的两包盐

最近基于 LiDAR 的 3D 对象检测 (3DOD) 方法显示出有希望的结果,但它们通常不能很好地推广到源(或训练)数据分布之外的目标域。为了减少此类域差距,从而使 3DOD 模型更具通用性,我们引入了一种新颖的无监督域适应 (UDA) 方法,称为 CMDA,该方法 (i) 利用来自图像模态的视觉语义线索(即 ...

0 0 0 0 2024/03/29 arXiv:2403.03721v2 爱吃鱼的两包盐

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)