网络攻击的不断提高,鼓励了机器学习技术在入侵检测系统中的整合,但是对抗性实例的兴起提出了重大挑战。这些精心设计的扰动误导了ML模型,使攻击者能够逃避检测或触发虚假警报。作为一种反应,对抗性纯化已成为一种引人注目的解决方案,尤其是在显示出令人鼓舞的结果的扩散模型中 ...
图形神经网络(GNN)旨在将深度学习技术扩展到图形数据,并在近年来在图形分析任务(例如节点分类)方面取得了重大进展 ...
网络嵌入旨在将网络数据投影到低维特征空间中,在该空间中,节点被表示为独特的特征向量,并且可以有效地保留网络结构。近年来,越来越多的在线应用程序服务网站可以表示为庞大而复杂的网络,对于传统的机器学习算法而言,这是极具挑战性的。将复杂网络数据的有效嵌入到低维特征表示中可以节省数据存储空间,并启用适用于处理网络数据的传统机器学习算法 ...
实体链接是现代检索系统中通常由第三方工具包执行的标准组件。尽管有大量的开源选项,但很难找到一个具有模块化体系结构的系统,该系统可以更换某些组件,不依赖于外部来源,很容易更新为较新的Wikipedia版本,并且最重要的是,最重要的是具有最先进的性能。本文介绍的REL系统旨在填补这一空白 ...
指令调优有潜力激发或增强大型语言模型(LLM)的特定功能。然而,实现数据的正确平衡对于防止灾难性遗忘和任务之间的干扰至关重要。为了解决这些限制并提高训练灵活性,我们提出了-Loras(MOA)的混合物架构 ...
基于 Transformer 和基于CNN的方法在长期预测中表现出强烈的性能。但是,它们的高计算和存储要求可能会阻碍大规模的部署。为了解决此限制,我们建议使用知识蒸馏(KD)将轻量级MLP与高级体系结构集成 ...
代码文档是软件开发的关键方面,它是人类理解与机器可读代码之间的桥梁。除了协助开发人员理解和维护代码外,文档还在自动化各种软件工程任务(例如测试Oracle生成(TOG))中起着至关重要的作用。在Java中,Javadoc注释提供了直接嵌入源代码中的结构化的自然语言文档,通常会详细介绍功能,用法,参数,返回值和异常 ...
时间序列数据无处不在 - 从金融到医疗保健 - 每个领域都带来了自己独特的复杂性和结构。虽然诸如变形金刚和图形神经网络(GNN)之类的高级模型在时间序列预测中已获得了知名度,这在很大程度上是由于它们在语言建模等任务中的成功,但并非总是必要的。在我们的工作中,我们表明,简单的前馈神经网络(SFNNS)可以在这些最新模型上或超过这些最先进的模型上达到甚至超过这些最新模型的性能,同时更简单,更小,更快, ...