学术界和工业界对大型语言模型 (LLM) 的依赖日益增加,因此需要全面了解其对提示的鲁棒性。为了满足这一重要需求,我们引入了 PromptBench,这是一个稳健性基准,旨在衡量 LLM 对对抗性提示的适应能力。这项研究使用了大量的对抗性文本攻击,针对多个级别的提示:字符、单词、句子和语义 ...

0 0 0 0 2024/03/29 arXiv:2306.04528v4 Wangyanyan0619

语言模型,特别是预训练的大型语言模型,已经展示了作为少镜头上下文学习器(ICL)的非凡能力,只需在输入上下文中进行几次演示即可适应新任务。然而,模型执行 ICL 的能力对小样本演示的选择很敏感。最近的一项发展是检索针对每个输入查询定制的演示,而不是使用一组固定的演示 ...

0 0 0 0 2024/03/18 arXiv:2401.11624v4 Wangyanyan0619

在电子商务搜索领域,语义匹配的重要性怎么强调都不为过,因为它直接影响用户体验和公司收入。沿着这条线,查询重写作为弥合语义匹配过程中固有的语义差距的重要技术,受到了工业界和学术界的广泛关注。然而,现有的查询重写方法往往难以有效优化长尾查询并缓解语义差距导致的“少召回”现象 ...

0 0 0 0 2024/03/18 arXiv:2311.03758v3 Wangyanyan0619

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)