大规模语言模型 (LLM) 因其无法处理冗长的输入而受到限制。为了解决这个限制,我们提出了自控记忆(SCM)系统来释放大规模语言模型的无限长度输入能力。我们的SCM系统由三个关键模块组成:语言模型代理、内存流和内存控制器 ...
大型语言模型(LLM)路由已成为一种至关重要的策略,可以通过基于查询复杂性将查询动态分配给最合适的模型来平衡计算成本与性能。尽管最近的进展表明,基于偏好的路由器的表现可以胜过传统方法,但当前的评估基准仍有限。他们在很大程度上专注于通用模型能力,同时忽略了特定于任务的行为以及通过偏好数据引入的隐私,安全性和潜在的后门漏洞等关键问题 ...
培训有效的AI代理进行多转交互作用需要高质量的数据,以捕获现实的人类代理动力学,但是手动收集的数据却很少且昂贵。我们介绍了Apigen-MT,这是一个两阶段的框架,生成可验证和多样化的多转变代理数据。在第一阶段,我们的代理管道通过基本操作产生详细的任务蓝图,利用LLM审阅者委员会和迭代反馈循环 ...
智能代理商的时代来自我们,这是由大语言模型的革命进步驱动的。具有目标驱动行为和动态适应能力的大型语言模型(LLM)代理可能代表了人工通用智能的关键途径。该调查通过以方法论为中心的分类法,将建筑基础,协作机制和进化途径联系起来,系统地解构了LLM代理系统 ...
对机器行为的标准化和量化评估是理解LLM的症结所在。在这项研究中,我们通过利用人格理论作为研究机器行为的工具,从心理测量研究中汲取灵感。作为对人类行为的哲学追求,对个性的研究研究了个人在思维,感觉和行为方面的差异 ...
大型语言模型(LLMS)在预测文本中的人类情绪方面表现出了有希望的能力。但是,这些模型处理情绪刺激的机制在很大程度上尚未探索。我们的研究通过调查自回归的LLM如何推断情绪来解决这一差距,这表明情绪表示在功能上位于模型中的特定区域 ...
尽管代理互动和个性化都是大语模型研究(LLM)研究中充满活力的主题,但对语言互动对角色条件的LLM代理行为的影响的关注量有限。这样的努力对于确保代理人与其指定的特征保持一致,但能够进行开放的自然对话很重要。在我们的实验中,我们调节GPT-3 ...
心理评估工具长期以来帮助人类了解行为模式。尽管大型语言模型(LLM)可以生成与人类相当的内容,但我们探索它们是否表现出人格特征。为此,这项工作将心理工具应用于LLM,以产生人格概况 ...
从擅长单模态任务的 Specific-MLLM,到扩展通用模态范围的 Omni-MLLM,这种演变旨在实现多模态信息的理解和生成。 Omni-MLLM 将不同模态的特征视为不同的“外语”,从而在统一的空间内实现跨模态交互和理解。为了促进相关研究的进步,我们整理了47篇相关论文,为社区提供对Omni-MLLM的全面介绍 ...
我们提出了Unified-io,该模型执行了跨越经典计算机视觉任务任务的各种AI任务,包括姿势估计,对象检测,深度估计和图像产生,视觉和语言任务,例如区域字幕和引用表达,以自然语言处理任务,例如询问答案和paraphrasing。由于与每个任务有关的异质输入和输出,包括RGB图像,每个像素映射,二进制掩码,边界框和语言,为如此多的任务开发单个统一模型引起了独特的挑战。我们通过将每个受支持的输入和输出均匀地归因于一系列离散的词汇 Token 来实现这一统一 ...