尽管性能出色,但神经架构搜索(NAS)因计算量大而受到批评。最近,零样本 NAS 通过利用零成本 (ZC) 代理而成为一种有前景的方法,可显着降低计算需求。尽管如此,现有的 ZC 代理严重依赖专家知识,并会产生大量的试错成本 ...
我们推出了 DySample,一款超轻量且的动态上采样器。虽然最近高效的基于内核的动态上采样器(例如 CARAFE、FADE 和 SAPA)取得了令人印象深刻的性能提升,但它们引入了很多工作负载,主要是由于运行的动态波形和用于生成动态内核的附加子网络。此外,FADE和SAPA对高分辨率特征在一定程度上限制了它们的应用场景引导的需求... ...
推荐系统在各种在线服务中发挥着至关重要的作用。然而,在特定领域内单独和训练部署的隔离性质限制使他们获得开放世界知识的机会。最近,大型语言模型(LLM)的出现带来了希望通过编码广泛的世界知识并展示推理能力来弥补这种差距…… ...
近期工作总结了在老挝的大型语言模型(LLM)环境中完成时间序列(TS)任务的两种方法:LLM-for-TS(以模型为中心)设计和训练大型模型,或操基本预训练的模型 TS 数据 LLM ; TS-for-LLM(以数据为中心)将 TS 转换为模型模式的表示形式,使预训练的 LLM 能够处理 TS 数据。由此数据缺乏、资源有限、语义上下文要求等问题,本工作主要针对 TS-for-LLM,旨在通过设计适 ...
Transformer 架构已成为自然语言处理任务事实上的标准,但其在视觉中的应用仍然有限。在视觉中,焦点结合或与本质网络应用,或用于替换视觉网络的某些组件,同时保持其整体结构不变。我们证明,对CNN的依赖是不必要的,直接评估此类图像块序列的纯Transformer可以在图像分类任务上表现良好... ...
无人机遥感以其信息获取快、成本低等优势,在应急响应等领域得到广泛应用。然而,由于拍摄距离和成像机制的影响,图像中的物体存在尺寸小、分布密集、类间区分度低等挑战。为此,我们提出了一种多模态遥感检测网络,采用称为 RemoteDet-Mamba 的四向选择性扫描融合策略 ...
大规模视觉基础模型在自然图像的视觉任务中取得了显着进展,视觉转换器因其良好的可扩展性和表示能力而成为首选。然而,遥感(RS)中的大规模模型尚未得到充分探索。在本文中,我们采用具有约 1 亿个参数的普通视觉 Transformer,并首次尝试提出适合 RS 任务的大型视觉模型,并研究此类大型模型的性能 ...
尽管多模态大语言模型(MLLM)最近取得了进展,但它们的开发主要集中在以英语和西方为中心的数据集和任务上,而导致世界上大多数语言和不同文化背景的代表性不足。本文介绍了 Pangea,这是一种在 PangeaIns 上训练的多语言多模式 LLM ,PangeaIns 是一个涵盖 39 种语言的多样化 6M 指令数据集。 PangeaIns 的特点:1) 高质量的英语说明,2) 仔细的机器翻译说明,3 ...