在本文中,我们专注于无监督的机器阅读理解域(MRC),其中源域具有大量的标记数据,而目标域中仅可用无标记的段落。为此,我们提出了一个对抗性域适应框架(ADAMRC),其中($ i $)伪问题首先是针对目标域中未标记的段落生成的,然后($ ii $)将域分类器纳入MRC模型,以预测哪个域是一个给定的通道Questage-Quemestage-Quemestage-Quemestage-Quemestage-Questage-Questage-Questage-Questage-everage。分类器和段落问题编码器是使用对抗性学习共同训练的,以实施域名不变的表示 ...
元学习已成为一种趋势技术,可以解决一些播放文本分类并实现最先进的表现。但是,现有解决方案在很大程度上依赖于词汇特征及其分布签名对培训数据的开发,同时忽略了该模型适应新任务的能力。在本文中,我们提出了一个新颖的元学习框架,该框架与对抗性域自适应网络集成在一起,旨在提高模型的自适应能力并为新类生成高质量的文本嵌入 ...
网络安全领域正在迅速发展。需要了解过去,当前和 - 在最好的情况下 - 即将到来的威胁,因为攻击变得越来越高,目标更大,系统更加复杂。由于无法手动解决此问题,因此网络安全专家需要依靠机器学习技术 ...
近年来,在英语的情感分类中取得了巨大的成功,部分原因是可用的大量注释资源。不幸的是,大多数语言都不享受如此丰富的标记数据。为了解决低资源语言的情感分类问题,没有足够的注释数据,我们提出了一个对抗性深度平均网络(ADAN),以将知识从有关资源丰富的源语言的标记数据传输到仅存在的无标记数据的低资源语言 ...
无监督的域适应性最近已成为将深层神经网络推广到新目标域的有效范式。但是,仍然有巨大的潜力来达到充分的监督性能。在本文中,我们提出了一种新颖的主动学习策略,以帮助目标域中的知识转移,称为活动领域的适应性 ...
在目标域上学习算法的域自适应性能是其源域误差的函数和这两个域的数据分布之间的差异度量。我们在NLP任务的背景下介绍了各种基于距离的度量的研究,该研究表征了基于样本估计的域之间的差异。我们首先进行分析实验,以表明这些距离测量中的哪些可以最好地将样品与同一域与不同领域区分开,并且与经验结果相关 ...
将知识从标记的源域中学到的知识转移到无监督域适应(UDA)的原始目标域(UDA)对于自动驾驶系统的可扩展部署至关重要。 UDA中的最新方法通常采用一个关键思想:利用来自源和目标域的联合监督信号进行自我训练。在这项工作中,我们改善并扩展了这一方面 ...
近年来,人们对将C代码转换为生锈,从而受益于生锈的记忆和线程安全保证。 C2RUST是一个基于规则的系统,可以自动将C代码转换为功能相同的RUST,但是它产生的锈蚀代码是非异常的,即 ...
维护和扩展软件系统在很大程度上取决于有效的代码重构,但是此过程仍然是劳动密集型的,要求开发人员仔细分析现有代码库并防止引入新的缺陷。尽管最近的进步利用了大型语言模型(LLMS)来自动化重构任务,但当前解决方案在范围和缺乏机制方面受到限制,无法保证代码汇编和成功的测试执行。在这项工作中,我们介绍了Mantra,这是一个基于LLM代理的综合框架,可自动化方法级重构 ...
确保大语模型(LLM)生成的代码的鲁棒性对于现实世界的可靠性至关重要。但是,现有评估主要集中在正确性上,通常会忽略关键的鲁棒性问题,例如丢失输入验证和错误处理不足。在本文中,我们介绍了有关LLM生成代码鲁棒性的首次实证研究 ...