这项工作旨在深入研究基于及时的事件参数提取(EAE)模型。我们探讨了将各种信息纳入提示对模型性能的影响,包括触发器,同一事件的其他角色参数以及同一文档中多个事件的角色参数。此外,我们提供了及时基于基于的EAE模型可以达到的最佳性能,并可以从培训目标的角度进一步优化此类模型 ...
如今,现实世界的应用程序经常面对流数据,这需要学习系统随着数据的演变吸收新的知识。持续学习(CL)旨在实现这一目标,同时克服学习新知识时对旧知识的灾难性遗忘。典型的 CL 方法从头开始构建模型,并随着传入数据而增长 ...
大型语言模型 (LLM) 在自然语言处理 (NLP) 任务中发挥着至关重要的作用,可提高翻译、摘要和文本分类等领域对人类语言的理解、生成和操作。先前的研究表明,基于指令的 LLM 可以有效地用于数据增强,以生成多样化且真实的文本样本。这项研究应用基于提示的数据增强来检测俄罗斯社交媒体中对绿色实践的提及 ...
将固定标签池中的标签子集分配给给定的输入文本是许多实际应用程序(例如推荐系统)中的文本分类问题。两个独立的研究流解决了这个问题。分层文本分类 (HTC) 专注于具有数百个条目的较小标签池的数据集,并伴有语义标签层次结构 ...
跨不同领域的在线文本内容呈指数级增长,需要先进的自动文本分类方法。基于 Transformer 架构的大型语言模型 (LLM) 在该领域取得了巨大成功,特别是在自然语言处理 (NLP) 任务中。然而,由于专业词汇和不平衡数据等独特的挑战,通用 LLM 经常难以处理特定领域的内容,例如科学文本 ...
短文本分类是信息检索(IR)中的常见子任务。图机器学习的最新进展引起了人们对针对低资源场景的基于图的方法的兴趣,在这种情况下显示出了前景。然而,现有方法面临局限性,例如未考虑相同单词的不同含义或转导方法的限制 ...
零样本思维链 (CoT) 提示作为一种简单而有效的策略出现,可增强大型语言模型 (LLM) 在现实世界推理任务中的性能。尽管如此,统一应用于整个实例的单一任务级提示的功效本质上是有限的,因为一个提示不可能成为所有实例的好伙伴,更合适的方法应该仔细考虑提示与每个实例之间的交互。这项工作通过自适应区分好提示和坏提示,引入了实例自适应提示算法作为替代的零样本 CoT 推理方案 ...