检索增强方法通过利用外部资源的有用信息来支持下游任务,受到越来越多的关注。最近的研究主要集中在探索检索来解决知识密集型(KI)任务。然而,大多数非知识密集型(NKI)任务的检索潜力仍未得到充分开发 ...

0 0 0 0 2024/12/15 arXiv:2305.17653v1 niuzai

给定文本段落和答案,人类能够用各种表达方式提出问题,但这种能力对于大多数问题生成(QG)系统来说仍然具有挑战性。现有的解决方案主要关注给定段落内的内部知识或语义词空间,以进行多样化的内容规划。然而,这些方法没有考虑外部知识对于表达多样性的潜力 ...

0 0 0 0 2024/12/15 arXiv:2310.14503v1 niuzai

词汇和语义匹配通常用作信息检索的相关性度量。他们一起估计查询和候选之间的语义等价性。然而,语义等价并不是检索多跳问题的证据时需要考虑的唯一相关性信号 ...

0 0 0 0 2024/12/14 arXiv:2311.02616v1 niuzai

密集检索已成为在开放域 NLP 任务中获取相关上下文或世界知识的重要方法。当我们在推理时在检索语料库上使用学习的密集检索器时,经常被忽视的设计选择是对语料库进行索引的检索单元,例如 ...

0 0 0 0 2024/12/14 arXiv:2312.06648v3 niuzai

检索增强生成(RAG)旨在增强大型语言模型(LLM),借助从外部知识源检索到的上下文生成更准确、更可靠的答案,从而减少幻觉的发生率。尽管取得了进步,但由于以下问题,评估这些系统仍然是一个重要的研究领域:(1)数据多样性有限:知识源和查询类型的多样性不足限制了 RAG 系统的适用性; (2)问题定位模糊:现有评估方法难以定位RAG管道中出现问题的阶段; (3)检索评估不稳定:这些方法往往无法有效评估检索性能,特别是当分块策略发生变化时。为了应对这些挑战,我们提出了一个综合全链评估(CoFE-RAG)框架,以促进对整个 RAG 管道的彻底评估,包括分块、检索、重新排名和生成 ...

0 0 0 0 2024/12/09 arXiv:2410.12248v1 niuzai

标准语言模型通过从固定、有限和独立的词汇表中选择标记来生成文本。我们引入了一种新颖的方法,可以从支持文档集合中选择上下文感知短语。这种范式转变最重大的挑战之一是确定训练预言,因为可以以各种方式对文本字符串进行分段,并且可以从许多可能的文档中检索每个分段 ...

0 0 0 0 2024/12/08 arXiv:2402.17532v3 niuzai

检索增强生成(RAG)框架通过引用外部知识在开放域问答任务上展示了最先进的性能。然而,当 RAG 系统被提供低相关性的上下文或输入上下文之间的相对相关性评估不准确时,它会面临性能下降的挑战。在这项工作中,我们提出了一个 RE-RAG 框架,它将显式上下文相关性估计器 (RE) 注入到 RAG 系统中 ...

0 0 0 0 2024/12/08 arXiv:2406.05794v3 niuzai

检索增强语言模型(RALM)在知识密集型任务中表现出强大的性能和广泛的适用性。然而,由于 RALM 容易产生不忠实的输出,包括毫无根据的信息或与检索到的上下文相矛盾,因此存在严重的可信度问题。本文提出了 SynCheck,这是一种轻量级监控器,它利用细粒度解码动态,包括序列似然、不确定性量化、上下文影响和语义对齐来同步检测不忠实句子 ...

0 0 0 0 2024/12/06 arXiv:2406.13692v2 niuzai

我们从大型语言模型的角度关注文本到 SQL 的语义解析。受到与商业数据库模式的大小和商业智能解决方案的可部署性相关的挑战的推动,我们提出了一种动态检索输入数据库信息并使用抽象语法树来选择少量样本进行上下文学习的方法。此外,我们还研究了可以在多大程度上利用并行语义解析器来生成预期 SQL 查询的 $\textit{approximated}$ 版本,以支持我们的检索 ...

0 0 0 0 2024/12/04 arXiv:2407.03227v2 niuzai

新意图发现(NID)致力于在开放世界场景中识别已知的并合理推断新的意图组。但当前的方法面临着不准确的伪标签和较差的表示学习的问题,从而产生了负反馈循环,降低了模型的整体性能,包括准确性和调整后的兰特指数。为了解决上述挑战,我们提出了一种通过 EM 风格方法优化的鲁棒新意图发现(RoNID)框架,该框架专注于构建可靠的伪标签并获得集群友好的判别表示 ...

0 0 0 0 2024/08/26 arXiv:2404.08977v2 niuzai

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)