个性签名 ...
数据增强旨在丰富训练样本,以缓解资源匮乏或类别不平衡情况下的过度拟合问题。传统方法首先设计同义词替换等针对特定任务的操作,然后人为预设替换率等相应参数,需要大量先验知识,并且容易陷入次优。此外,以前的方法中编辑操作的数量受到限制,这降低了增强数据的多样性,从而限制了性能增益 ...
尽管时间变量很重要,但它在 NLP 和语言模型文献中基本上被忽视了。在本文中,我们提出了 TimeLM,这是一组专门研究历时 Twitter 数据的语言模型。我们表明,持续学习策略有助于增强基于 Twitter 的语言模型处理未来和未分发推文的能力,同时使其与标准化和更单一的基准相比具有竞争力 ...
高分辨率卫星影像可以为土地覆盖分类提供丰富、详细的空间信息,这对于研究复杂的建筑环境尤为重要。然而,由于复杂的土地覆盖模式、昂贵的训练样本收集以及卫星图像分布的严重变化,很少有研究将高分辨率图像应用于大比例尺详细类别的土地覆盖制图。为了填补这一空白,我们提出了一个大规模土地覆盖数据集,即 50 亿像素 ...