一译 —— 文档和论文翻译、对照阅读、讨论和社区

A survey of agent interoperability protocols: Model Context Protocol (MCP), Agent Communication Protocol (ACP), Agent-to-Agent Protocol (A2A), and Agent Network Protocol (ANP)

大语言模型（LLM）功率的自主代理需要强大的标准化协议，以整合工具，共享上下文数据并跨异构系统协调任务。临时集成难以扩展，安全和跨性别范围。这项调查研究了四个新兴代理通信协议：模型上下文协议（MCP），代理通信协议（ACP），代理到代理协议（A2A）和代理网络协议（ANP），每个协议都在不同的部署环境中解决互操作性 ...

0 0 0 2025/06/19 arXiv:2505.02279v2 siweima

When to use Graphs in RAG: A Comprehensive Analysis for Graph Retrieval-Augmented Generation

Graph检索效果生成（GraphRag）已成为具有外部知识增强大型语言模型（LLM）的强大范式。它利用图形来对特定概念之间的层次结构进行建模，从而使更连贯和有效的知识检索能够准确地进行此HTTP URL的概念上的承诺，最近的研究报告说，GraphRag经常在许多现实世界任务上表现不佳。这提出了一个关键的问题：GraphRag真的有效吗？在哪些情况下，图形结构为抹布系统提供了可衡量的好处？为了解决 ...

0 0 0 2025/06/19 arXiv:2506.05690v1 liuweitang

GUI-Bee: Align GUI Action Grounding to Novel Environments via Autonomous Exploration

图形用户界面（GUI）操作接地是GUI自动化的关键步骤，该步骤将语言说明映射到GUI屏幕上可行的元素。 GUI Action接地的最新作品利用了大型GUI数据集来微调MLLM。但是，微调数据始终涵盖有限的GUI环境，我们发现所得模型的性能在新颖的环境中恶化 ...

0 0 0 2025/06/19 arXiv:2501.13896v2 steven_adam

Towards Understanding the Overfitting Phenomenon of Deep Click-Through Rate Prediction Models

深度学习技术已广泛应用于工业推荐系统。但是，在推荐系统中，人们对模型过度问题的关注要少得多，相反，这被认为是深神经网络的关键问题。在点击率率（CTR）预测的背景下，我们观察到一个有趣的单上述过度拟合问题：模型性能在第二个时期开始时表现出巨大的退化 ...

0 0 0 2025/06/19 arXiv:2209.06053v1 18310917935

Training-free Linear Image Inverses via Flows

解决无培训的反问题涉及使用预验证的生成模型，并对生成过程进行适当的修改，以避免生成模型的填充。尽管最近的方法探索了扩散模型的使用，但它们仍然需要对许多超参数进行手动调整以解决不同的反问题。在这项工作中，我们提出了一种通过验证的流量模型来解决线性反问题的无训练方法，利用理论上合并的加权方案利用流量匹配模型的简单性和效率，从而大大减少了手动调整的量 ...

0 0 0 2025/06/19 arXiv:2310.04432v2 rommelcyzyb

Speculative Prefill: Turbocharging TTFT with Lightweight and Training-Free Token Importance Estimation

在现代大型语言模型（LLM）推理引擎中，改善时间率（TTFT）是一个重要的目标。优化TTFT可以直接导致更高的最大QP，并满足许多关键应用的要求。但是，众所周知，提高TTFT是具有挑战性的，因为它是由计算限制的，并且性能瓶颈从许多先前的作品专注于MLP部分的自我发作转变 ...

0 0 0 2025/06/19 arXiv:2502.02789v2 Daenerays

CMT-LLM: Contextual Multi-Talker ASR Utilizing Large Language Models

在实际应用程序中，自动语音识别（ASR）系统必须处理来自多个扬声器的重叠语音，并识别诸如技术术语之类的稀有词。传统方法分别解决了多样性ASR和上下文偏见，从而限制了复杂方案的性能。我们提出了一个统一的框架，该框架结合了多对话者的重叠语音识别和上下文偏见，将其构成一个任务 ...

0 0 0 2025/06/19 arXiv:2506.12059v1 zhangqi33

HarMoEny: Efficient Multi-GPU Inference of MoE Models

专家的混合物（MOE）模型仅通过激活给定输入的专业专家的一部分来提供推断期间的计算效率。这可以在使用专家并行性的多GPU系统上进行有效的模型缩放，而不会损害性能。但是，专家和GPU之间的负载失衡会引入等待时间，这可能会大大增加推断潜伏期 ...

0 0 0 2025/06/19 arXiv:2506.12417v2 anhao

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）