黑盒机器学习模型现在通常用于高风险环境,例如医疗诊断 ...
低光图像增强(LLIE)旨在改善在照明较差的环境中捕获的图像的感知或解释性。该领域的最新进展主要由基于深度学习的解决方案主导,在这些解决方案中,许多学习策略,网络结构,损失功能,培训数据等都采用了 ...
时空预测学习旨在通过从历史框架中学习来产生未来的框架。在本文中,我们研究了现有的方法,并提出了时空预测学习的一般框架,其中空间编码器和解码器捕获框内特征和中间时间模块捕获框架间相关性。尽管主流方法采用经常性单元来捕获长期的时间依赖性,但由于无法平行的架构,它们的计算效率低 ...
尽管基于学习的对象检测方法在常规数据集上取得了有希望的结果,但是从不利天气条件下捕获的低质量图像中找到对象仍然具有挑战性。现有方法在平衡图像增强和对象检测的任务方面遇到困难,或者通常忽略对检测有益的潜在信息。为了减轻这个问题,我们提出了一种新型的图像自适应Yolo(IA-YOLO)框架,在该框架中,每个图像都可以自适应增强,以更好地检测性能 ...
Deepfakes 由于可能传播虚假信息并损害数字媒体的完整性而引起了人们的严重关注。在这项工作中,我们提出了一种用于深度伪造视频检测的生成卷积视觉变换器(GenConViT)。我们的模型结合了 ConvNeXt 和 Swin Transformer 模型进行特征提取,并利用自动编码器和变分自动编码器从潜在数据分布中学习 ...
原子簇扩展(Drautz,Phys。V.B 99,2019)为系统地得出多项式基础函数提供了一个框架,以近似等级和置换不变函数,尤其是对原子系统的建模属性 ...
在视觉场所识别中,在不同的环境条件和观点下,准确识别和匹配位置的图像仍然是一个重大挑战。在本文中,我们介绍了一种名为“ Queries of Queries(Boq)”的新技术,该技术学习了一组旨在捕获特定地点特定属性的全球查询。与使用自我注意力并直接从输入特征生成查询的现有方法不同,Boq采用了独特的可学习的全球查询,该查询通过交叉注意探测输入功能,以确保一致的信息聚集 ...
以对象为中心的多感官感知、推理和交互一直是近年来的重点研究课题。然而,这些方向的进展受到可用对象集的限制,合成对象不够真实,并且大多以几何图形为中心,而 ...