大型语言模型(LLM)通过流行的思想链(COT)提示证明了各种推理任务的紧急功能。但是,这种简单而快速的COT方法通常会遇到解决复杂问题的局限性,而一种详尽的方法,它考虑了多种推理途径并仔细验证每个步骤,从而导致推理速度较慢。本文解决了使LLMS能够在快速和缓慢推理方法之间自主选择的挑战,从而优化了效率和有效性 ...
大型语言模型(LLM)彻底改变了各种NLP任务。积极的辩论是他们可以在多大程度上进行推理和计划。先前的工作已根据手动将三个PDDL域转换为自然语言(NL)提示,在PDDL计划的具体情况下评估了后者 ...
我们介绍了一种新方法,该方法从大型语言模型(LLM)中提取知识来生成对象级别的计划,该计划描述了对象状态的高级变化,并使用它们来引导任务和运动计划(TAMP)。现有工作使用LLM直接输出任务计划或在PDDL等表示中生成目标。但是,这些方法不足,因为它们依靠LLM来执行实际计划或输出难以满足的目标 ...
大型语言模型(LLMS)在解决自然语言描述的计划任务方面已显示出希望,但是它们的直接使用通常会导致推理和幻觉不一致。尽管混合LLM-Symbolic计划管道已成为更强大的替代方案,但它们通常需要大量的专家干预来完善和验证生成的动作模式。它不仅限制了可扩展性,而且还引入了偏见解释的潜力,因为一个专家对模棱两可的自然语言描述的解释可能与用户的实际意图不符 ...
自动化规划和调度是人工智能(AI)的增长领域之一,在该领域中提到LLM已受欢迎。基于对126篇论文的全面评论,本文根据LLMS在解决计划问题的各个方面的独特应用中研究了八个类别:语言翻译,计划产生,模型构建,多代理计划,互动计划,互动式计划,启发式方法优化,工具集成,工具集成和脑力启发计划。对于每个类别,我们阐明了所考虑的问题和现有差距 ...
Web刮擦是一种强大的技术,可从网站中提取数据,启用自动数据收集,增强数据分析功能并最大程度地减少手动数据输入工作。现有方法,基于包装纸的方法在面对新网站时具有有限的适应性和可伸缩性,而由大语言模型(LLMS)授权的语言代理在不同的网络环境中的可重复使用性较差。在这项工作中,我们介绍了使用LLMS生成Web刮刀的范式,并提出了AutoScraper,这是一个两阶段的框架,可以更有效地处理多样化和更改的Web环境 ...
尽管大型语言模型具有出色的性能来生成自然语言文本,但由于神经模型难以从自由形式的文本捕获隐含的规则,因此很难根据给定任务生成正确的逻辑文本。在本文中,我们提出了一种新型的基于图的语言模型逻辑GLM,将逻辑注入语言模型中,以获得更有效的文本生成和解释性。具体来说,我们首先从自然语言指令中捕获信息,并构建通常描述域的逻辑贝叶斯图 ...
计划在以任务为导向的对话框(TODS)中的代理人是至关重要的任务。人类代理通常通过遵循预定义的工作流,将工作流程分解为可起作的项目,以及通过按顺序执行API来解决操作,从而解决用户问题;所有这些都需要推理和计划。随着LLM的最新进展,越来越多地尝试将其用于任务计划和API使用 ...
研究人员正在投入大量精力来开发强大的通用代理,其中基础模型被用作代理系统中的模块(例如思想链、自我反思、工具形成器) ...
慢速思维机制与大语言模型(LLMS)的集成为实现2级AGI推理器提供了一种有希望的方法,如Openai的O1这样的系统所示例。但是,仍然存在一些重大挑战,包括效率低下的过度思考和对辅助奖励模型的过度依赖。我们指出,这些局限性源于LLMS无法内部化搜索过程,这是有效推理的关键组成部分 ...