niuzai的文档

niuzai

个性签名 ...

Synchronous Faithfulness Monitoring for Trustworthy Retrieval-Augmented Generation

检索增强语言模型（RALM）在知识密集型任务中表现出强大的性能和广泛的适用性。然而，由于 RALM 容易产生不忠实的输出，包括毫无根据的信息或与检索到的上下文相矛盾，因此存在严重的可信度问题。本文提出了 SynCheck，这是一种轻量级监控器，它利用细粒度解码动态，包括序列似然、不确定性量化、上下文影响和语义对齐来同步检测不忠实句子 ...

0 0 0 0 2024/12/06 arXiv:2406.13692v2 niuzai

Improving Retrieval-augmented Text-to-SQL with AST-based Ranking and Schema Pruning

我们从大型语言模型的角度关注文本到 SQL 的语义解析。受到与商业数据库模式的大小和商业智能解决方案的可部署性相关的挑战的推动，我们提出了一种动态检索输入数据库信息并使用抽象语法树来选择少量样本进行上下文学习的方法。此外，我们还研究了可以在多大程度上利用并行语义解析器来生成预期 SQL 查询的 $\textit{approximated}$ 版本，以支持我们的检索 ...

0 0 0 0 2024/12/04 arXiv:2407.03227v2 niuzai

RoNID: New Intent Discovery with Generated-Reliable Labels and Cluster-friendly Representations

新意图发现（NID）致力于在开放世界场景中识别已知的并合理推断新的意图组。但当前的方法面临着不准确的伪标签和较差的表示学习的问题，从而产生了负反馈循环，降低了模型的整体性能，包括准确性和调整后的兰特指数。为了解决上述挑战，我们提出了一种通过 EM 风格方法优化的鲁棒新意图发现（RoNID）框架，该框架专注于构建可靠的伪标签并获得集群友好的判别表示 ...

0 0 0 0 2024/08/26 arXiv:2404.08977v2 niuzai

A New Dialogue Response Generation Agent for Large Language Models by Asking Questions to Detect User's Intentions

ChatGPT 等大型语言模型 (LLM) 由于其开放域生成功能，最近已应用于各种 NLP 任务。然而，将 LLM 应用于对话任务存在两个问题。 1. ...

0 0 0 0 2024/08/25 arXiv:2310.03293v1 niuzai

Putting Context in Context: the Impact of Discussion Structure on Text Classification

当前的文本分类方法通常关注要分类的内容。即使在基于在线讨论的任务中，语境方面（语言的和语言外的）通常被忽视。尽管如此，在许多情况下，可以有效地利用选择这些要素的背景的多方和多轮性质 ...

0 0 0 0 2024/08/25 arXiv:2402.02975v1 niuzai

Knowledgeable Prompt-tuning: Incorporating Knowledge into Prompt Verbalizer for Text Classification

使用特定于任务的提示调整预训练语言模型 (PLM) 是一种很有前景的文本分类方法。特别是，之前的研究表明，在低数据场景下，即时调整比带有额外分类器的通用微调方法具有显着的优越性。提示调整的核心思想是插入文本片段，即 ...

0 0 0 0 2024/08/25 arXiv:2108.02035v2 niuzai

LLM-based policy generation for intent-based management of applications

（（）分解为系统可以理解和执行的抽象。这是具有挑战性的，因为即使是一个简单的意图也需要执行许多有序的步骤。识别和调整这些步骤（随着条件的变化）的任务需要一种无法预先精确定义的分解方法... ...

0 1 0 0 2025/08/01 arXiv:2402.10067v1 niuzai

IntentionQA: A Benchmark for Evaluating Purchase Intention Comprehension Abilities of Language Models in E-commerce

增强语言模型（LM）在电子商务场景中理解购买意图的能力对于其有效协助各种下游任务至关重要。然而，以前从 LM 中提取意图的方法通常无法生成适用于现实世界电子商务环境的有意义且以人为中心的意图。这引发了人们对LM对购买意图的真实理解和利用的担忧 ...

0 0 0 0 2024/08/18 arXiv:2406.10173v1 niuzai

User Intent Recognition and Satisfaction with Large Language Models: A User Study with ChatGPT

GPT-4 Turbo 等大型语言模型的快速发展代表了数字交互和内容参与方面的影响深远的范式转变。虽然这些模型编码了大量人类生成的知识，并且擅长处理不同的数据类型，但最近的研究表明，它们经常面临准确响应特定用户意图的挑战，从而导致用户不满情绪增加。基于细粒度的意图分类和基于意图的提示重新表述，我们分析了（1）意图识别的质量和（2）用户对最近两个 ChatGPT 模型（GPT-3）基于意图的提示重新表述的答案的满意度 ...

0 0 0 0 2024/08/18 arXiv:2402.02136v1 niuzai

FireAct: Toward Language Agent Fine-tuning

最近的努力通过外部工具或环境增强了语言模型（LM），从而导致了可以推理和行动的语言代理的开发。然而，大多数这些智能体都依赖于现有的 LM 的小样本提示技术。中，我们对LM代理语言代理的被重视的方向进行了调查和争论... ...

0 0 0 0 2025/01/11 arXiv:2310.05915v1 niuzai