大型语言模型(LLM)变得越来越强大,能够处理复杂的任务,例如构建单个代理和多代理系统 ...
基于语言模型的大型多代理系统由于专家的协作而在各种任务中显示出很大的能力,每个人都集中在特定领域。但是,笨拙甚至恶意药物的影响,即 ...
当前的大型语言模型(LLMS)不仅限于某些最大上下文长度,而且无法强劲地消耗长输入。为了解决这些局限性,我们提出了ReadGent,这是一种LLM代理系统,在我们的实验中,将有效上下文长度提高到20倍。受到人类如何互动读取长文档的启发,我们将录像带作为一个简单的提示系统,它使用LLMS的先进语言能力来(1)决定将哪些内容存储在存储器情节中,(2)将这些记忆情节压缩为简短的情节记忆中,称为GIST记忆,称为GIST记忆,以及(3)在原始文本中查找段落中的文本中的操作,以启用读取的文本,以完成详细信息,以完成详细信息,以完成一定的详细信息 ...
情节记忆 - 回忆以时间和空间为基础的特定事件的能力 - 是人类认知的基石,不仅可以连贯讲故事,而且还可以计划和决策制定。尽管具有显着的功能,但大型语言模型(LLMS)缺乏强大的情节记忆机制:我们认为,将情节记忆能力整合到LLM中对于向AI促进AI迈向人类认知,提高其始终如一地推理和将其在真实事件中的输出扎根的潜力至关重要。为了应对这一挑战,我们引入了一个综合框架,以建模和评估LLM情节记忆功能 ...
我们提出了Rec-R1,这是一个通用的增强学习框架,该框架通过闭环优化将大型语言模型(LLMS)与建议系统桥接。与提示和监督微调(SFT)不同,REC-R1使用固定的黑盒推荐模型的反馈直接优化LLM生成,而无需依赖于GPT-4O等专有模型的合成SFT数据。这避免了数据蒸馏所需的大量成本和精力 ...
大型语言模型(LLM)的最新进展显着增强了对话系统的功能,使其适用于各个领域(例如,教育) ...
大型语言模型(LLMS),例如GPT3.5,在理解和生成自然语言方面表现出非常熟练的水平。另一方面,医疗助理有可能为个人提供可观的好处 ...
最近的大语言模型(LLM)驱动的聊天助手系统集成了内存组件来跟踪用户助手的聊天历史,从而实现更准确和个性化的响应。然而,它们在持续相互作用中的长期记忆能力仍未得到充分探索。本文介绍了 LongMemEval,这是一个综合基准测试,旨在评估聊天助理的五种核心长期记忆能力:信息提取、多会话推理、时间推理、知识更新和放弃 ...
由于信息的快速生成和传播,尽管开发成本巨大,大型语言模型(LLM)很快就过时了。由于保持模型更新的迫切需要,在线学习已成为利用 LLM 进行实际应用时的关键必需品。然而,鉴于未见过的文档的语料库不断扩大以及现代 LLM 的巨大参数空间,有效的适应至关重要 ...
在本文中,我们提出了MPC(模块化提示聊天机器人),这是一种创建高质量对话代理而无需进行微调的新方法。我们的方法通过使用少量发射提示,经过思考链(COT)和外部记忆等技术,利用预训练的大语言模型(LLM)作为长期一致性和灵活性的单个模块。我们的人类评估结果表明,MPC与开放域对话中的微调聊天机器人模型相提并论,这是创建一致且引人入胜的聊天机器人的有效解决方案 ...