自然语言处理的进步,例如从预训练的语言模型中进行转移学习,也影响了如何培训模型的编程语言任务。先前的研究主要探索了预训练的代码,并通过多模式和多任务处理将其扩展,但是下游任务的数据仍然适度。为了关注下游任务的数据利用,我们提出并调整增强方法,这些方法可在代码翻译和摘要中最多可提高高达6 ...
微调预审计的模型是域泛化(DG)任务中的常见实践。但是,由于预审预理论的型号的尺寸不断增长,微型调整通常在计算上很昂贵。更重要的是,这可能会导致过度拟合源域并损害其概括能力,如最近的作品所示 ...
这项工作提供了一个统一的框架,用于解决视觉监督域的适应和泛化的问题。主要思想是利用暹罗体系结构来学习一个具有歧视性的嵌入子空间,并在映射的视觉域在语义上进行对齐且最大程度地分开。监督设置变得有吸引力,尤其是当只需要标记目标数据样本时 ...
无线传感最近在包括房屋,办公室和公共场所在内的不同环境中发现了广泛的应用程序。通过分析渠道状态信息(CSI)中的模式,可以推断人类对人识别,手势识别和跌落检测等任务的行为。但是,CSI对环境变化高度敏感,即使很小的变化也会显着扭曲CSI模式 ...
我们通过将颗粒从初始源分布传输到目标分布,提出了一种生成模型的梯度流程,在该粒子上,粒子上的梯度场是由最大平均差异(MMD)的噪声自动剂量梯度给出的。噪声自适应MMD经过通过向前扩散过程获得的噪声损坏的数据分布进行培训,这通常用于降级扩散概率模型。结果是MMD梯度流的概括,我们称之为扩散-MMD级别流量或DMMD ...
近年来,由于其能够增强跨不同领域的模型泛化的能力,因此无监督的领域适应性(UDA)在自然语言处理(NLP)领域受到了重大关注。但是,其在不同法律领域之间进行知识转移的应用仍未得到探索。为了解决冗长且复杂的法律文本带来的挑战以及大规模注释数据集的有限可用性,我们提出了尤其是一种新型模型,旨在提高法律判断预测(LJP)任务的准确性 ...
尽管通过数据驱动的智能故障诊断技术可以取得显着的结果,但它们以相同的培训和测试数据分布以及足够的标记数据为前提。在实际情况下通常存在各种操作状态,从而导致域转移问题,从而阻碍了故障诊断的有效性。尽管最近无监督的域适应方法可以诊断跨域故障诊断,但他们努力从多个源域中有效利用信息并同时在多个目标域中实现有效的诊断故障 ...
对于不可用的标记数据的目标任务,域的适应性可以从其他源域转移学习者。以前的深层域适应方法主要学习全球域移位,即 ...
在许多实际应用中,获得足够的大规模标记数据来训练深层神经网络以达到其全部能力通常很困难和昂贵。因此,将学习的知识从单独的,标记的源域转移到未标记或稀疏标记的目标域成为一种吸引人的选择。但是,直接转移通常会导致由于域移动而导致巨大的性能衰减 ...
最近,有许多共同的任务是针对大型语言模型(LLM)生成的文本的检测的。但是,这些共享任务倾向于将重点放在文本仅限于一个特定领域的情况下,或者可以从许多域中进行文本的情况,而文本可以在测试时间内看不到。在此共享的任务中,使用新发布的RAID基准测试,我们旨在回答模型是否可以从大型但固定的域和LLM中检测出生成的文本,所有这些文本在培训期间都可以看到 ...