大型语言模型 (LLM) 在自然语言处理 (NLP) 任务中发挥着至关重要的作用,可提高翻译、摘要和文本分类等领域对人类语言的理解、生成和操作。先前的研究表明,基于指令的 LLM 可以有效地用于数据增强,以生成多样化且真实的文本样本。这项研究应用基于提示的数据增强来检测俄罗斯社交媒体中对绿色实践的提及 ...

0 0 0 0 2024/12/22 arXiv:2411.14896v1 jusir

将固定标签池中的标签子集分配给给定的输入文本是许多实际应用程序(例如推荐系统)中的文本分类问题。两个独立的研究流解决了这个问题。分层文本分类 (HTC) 专注于具有数百个条目的较小标签池的数据集,并伴有语义标签层次结构 ...

0 0 0 0 2024/12/22 arXiv:2411.13687v2 jusir

跨不同领域的在线文本内容呈指数级增长,需要先进的自动文本分类方法。基于 Transformer 架构的大型语言模型 (LLM) 在该领域取得了巨大成功,特别是在自然语言处理 (NLP) 任务中。然而,由于专业词汇和不平衡数据等独特的挑战,通用 LLM 经常难以处理特定领域的内容,例如科学文本 ...

0 0 0 0 2024/12/22 arXiv:2412.00098v1 jusir

短文本分类是信息检索(IR)中的常见子任务。图机器学习的最新进展引起了人们对针对低资源场景的基于图的方法的兴趣,在这种情况下显示出了前景。然而,现有方法面临局限性,例如未考虑相同单词的不同含义或转导方法的限制 ...

0 0 0 0 2024/12/22 arXiv:2412.12754v1 jusir

零样本思维链 (CoT) 提示作为一种简单而有效的策略出现,可增强大型语言模型 (LLM) 在现实世界推理任务中的性能。尽管如此,统一应用于整个实例的单一任务级提示的功效本质上是有限的,因为一个提示不可能成为所有实例的好伙伴,更合适的方法应该仔细考虑提示与每个实例之间的交互。这项工作通过自适应区分好提示和坏提示,引入了实例自适应提示算法作为替代的零样本 CoT 推理方案 ...

0 0 0 0 2024/12/14 arXiv:2409.20441v3 jusir

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)