niuzai的文档

niuzai

个性签名 ...

SCM: Enhancing Large Language Model with Self-Controlled Memory Framework

大规模语言模型 (LLM) 因其无法处理冗长的输入而受到限制。为了解决这个限制，我们提出了自控记忆（SCM）系统来释放大规模语言模型的无限长度输入能力。我们的SCM系统由三个关键模块组成：语言模型代理、内存流和内存控制器 ...

0 0 0 0 2025/05/10 arXiv:2304.13343v4 niuzai

How Robust Are Router-LLMs? Analysis of the Fragility of LLM Routing Capabilities

大型语言模型（LLM）路由已成为一种至关重要的策略，可以通过基于查询复杂性将查询动态分配给最合适的模型来平衡计算成本与性能。尽管最近的进展表明，基于偏好的路由器的表现可以胜过传统方法，但当前的评估基准仍有限。他们在很大程度上专注于通用模型能力，同时忽略了特定于任务的行为以及通过偏好数据引入的隐私，安全性和潜在的后门漏洞等关键问题 ...

0 0 0 0 2025/04/14 arXiv:2504.07113v1 niuzai

APIGen-MT: Agentic Pipeline for Multi-Turn Data Generation via Simulated Agent-Human Interplay

培训有效的AI代理进行多转交互作用需要高质量的数据，以捕获现实的人类代理动力学，但是手动收集的数据却很少且昂贵。我们介绍了Apigen-MT，这是一个两阶段的框架，生成可验证和多样化的多转变代理数据。在第一阶段，我们的代理管道通过基本操作产生详细的任务蓝图，利用LLM审阅者委员会和迭代反馈循环 ...

0 0 0 0 2025/04/08 arXiv:2504.03601v1 niuzai

Large Language Model Agent: A Survey on Methodology, Applications and Challenges

智能代理商的时代来自我们，这是由大语言模型的革命进步驱动的。具有目标驱动行为和动态适应能力的大型语言模型（LLM）代理可能代表了人工通用智能的关键途径。该调查通过以方法论为中心的分类法，将建筑基础，协作机制和进化途径联系起来，系统地解构了LLM代理系统 ...

0 0 0 0 2025/03/28 arXiv:2503.21460v1 niuzai

Evaluating and Inducing Personality in Pre-trained Language Models

对机器行为的标准化和量化评估是理解LLM的症结所在。在这项研究中，我们通过利用人格理论作为研究机器行为的工具，从心理测量研究中汲取灵感。作为对人类行为的哲学追求，对个性的研究研究了个人在思维，感觉和行为方面的差异 ...

0 0 0 0 2025/03/17 arXiv:2206.07550v3 niuzai

Mechanistic Interpretability of Emotion Inference in Large Language Models

大型语言模型（LLMS）在预测文本中的人类情绪方面表现出了有希望的能力。但是，这些模型处理情绪刺激的机制在很大程度上尚未探索。我们的研究通过调查自回归的LLM如何推断情绪来解决这一差距，这表明情绪表示在功能上位于模型中的特定区域 ...

0 0 0 0 2025/03/16 arXiv:2502.05489v1 niuzai

LLM Agents in Interaction: Measuring Personality Consistency and Linguistic Alignment in Interacting Populations of Large Language Models

尽管代理互动和个性化都是大语模型研究（LLM）研究中充满活力的主题，但对语言互动对角色条件的LLM代理行为的影响的关注量有限。这样的努力对于确保代理人与其指定的特征保持一致，但能够进行开放的自然对话很重要。在我们的实验中，我们调节GPT-3 ...

0 0 0 0 2025/03/16 arXiv:2402.02896v1 niuzai

SCM: Enhancing Large Language Model with Self-Controlled Memory Framework

How Robust Are Router-LLMs? Analysis of the Fragility of LLM Routing Capabilities

APIGen-MT: Agentic Pipeline for Multi-Turn Data Generation via Simulated Agent-Human Interplay

Large Language Model Agent: A Survey on Methodology, Applications and Challenges

Evaluating and Inducing Personality in Pre-trained Language Models

Mechanistic Interpretability of Emotion Inference in Large Language Models

LLM Agents in Interaction: Measuring Personality Consistency and Linguistic Alignment in Interacting Populations of Large Language Models

Evaluating Personality Traits in Large Language Models: Insights from Psychological Questionnaires

From Specific-MLLMs to Omni-MLLMs: A Survey on MLLMs Aligned with Multi-modalities

Unified-IO: A Unified Model for Vision, Language, and Multi-Modal Tasks

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您在阅读时勇敢地改正翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）