我们从大型语言模型的角度关注文本到 SQL 的语义解析。受到与商业数据库模式的大小和商业智能解决方案的可部署性相关的挑战的推动,我们提出了一种动态检索输入数据库信息并使用抽象语法树来选择少量样本进行上下文学习的方法。此外,我们还研究了可以在多大程度上利用并行语义解析器来生成预期 SQL 查询的 $\textit{approximated}$ 版本,以支持我们的检索 ...
新意图发现(NID)致力于在开放世界场景中识别已知的并合理推断新的意图组。但当前的方法面临着不准确的伪标签和较差的表示学习的问题,从而产生了负反馈循环,降低了模型的整体性能,包括准确性和调整后的兰特指数。为了解决上述挑战,我们提出了一种通过 EM 风格方法优化的鲁棒新意图发现(RoNID)框架,该框架专注于构建可靠的伪标签并获得集群友好的判别表示 ...
ChatGPT 等大型语言模型 (LLM) 由于其开放域生成功能,最近已应用于各种 NLP 任务。然而,将 LLM 应用于对话任务存在两个问题。 1. ...
当前的文本分类方法通常关注要分类的内容。即使在基于在线讨论的任务中,语境方面(语言的和语言外的)通常被忽视。尽管如此,在许多情况下,可以有效地利用选择这些要素的背景的多方和多轮性质 ...
使用特定于任务的提示调整预训练语言模型 (PLM) 是一种很有前景的文本分类方法。特别是,之前的研究表明,在低数据场景下,即时调整比带有额外分类器的通用微调方法具有显着的优越性。提示调整的核心思想是插入文本片段,即 ...
自动化管理需要将高层用户请求(例如意图)分解为系统可以理解和执行的抽象。这是具有挑战性的,因为即使是一个简单的意图也需要执行许多有序的步骤。识别和调整这些步骤(随着条件的变化)的任务需要一种无法预先精确定义的分解方法 ...
增强语言模型(LM)在电子商务场景中理解购买意图的能力对于其有效协助各种下游任务至关重要。然而,以前从 LM 中提取意图的方法通常无法生成适用于现实世界电子商务环境的有意义且以人为中心的意图。这引发了人们对LM对购买意图的真实理解和利用的担忧 ...
GPT-4 Turbo 等大型语言模型的快速发展代表了数字交互和内容参与方面的影响深远的范式转变。虽然这些模型编码了大量人类生成的知识,并且擅长处理不同的数据类型,但最近的研究表明,它们经常面临准确响应特定用户意图的挑战,从而导致用户不满情绪增加。基于细粒度的意图分类和基于意图的提示重新表述,我们分析了(1)意图识别的质量和(2)用户对最近两个 ChatGPT 模型(GPT-3)基于意图的提示重新表述的答案的满意度 ...
最近的努力通过外部工具或环境增强了语言模型(LM),从而导致了可以推理和行动的语言代理的开发。然而,大多数这些智能体都依赖于现有的 LM 的小样本提示技术。中,我们对LM代理语言代理的被重视的方向进行了调查和争论... ...