一译 —— 文档和论文翻译、对照阅读、讨论和社区

Systematic Outliers in Large Language Models

在大语言模型（LLM）中广泛观察到离群值，从而显着影响模型性能，并为模型压缩带来挑战。了解这些异常值的功能和形成机制至关重要。但是，现有的作品在很大程度上集中于从算法的角度降低异常值的影响，而缺乏对其原因和角色的深入调查 ...

0 0 0 2025/06/20 arXiv:2502.06415v2 Daenerays

Query2doc: Query Expansion with Large Language Models

本文介绍了一种简单而有效的查询扩展方法，称为QUERY2DOC，llm）生成伪文档，llm接受过网络规模文本语料库的培训，擅长知识记忆... ...

0 1 0 2025/06/20 arXiv:2303.07678v2 Farren

Large Language Models Know Your Contextual Search Intent: A Prompting Framework for Conversational Search

准确理解用户的上下文搜索意图一直是会话式搜索的一个重要挑战。由于会话搜索会话更加多样化和长尾，在有限数据上训练的现有方法在处理真实会话搜索场景时仍然表现出不令人满意的有效性和鲁棒性。最近，llm）在文本生成和对话理解方面表现出了惊人的能力... ...

0 0 0 2025/06/20 arXiv:2303.06573v2 lynne515

DetailFlow: 1D Coarse-to-Fine Autoregressive Image Generation via Next-Detail Prediction

本文介绍了细节流，这是一种粗到1D自回归（AR）图像生成方法，该方法通过新颖的隔壁预测策略来对图像进行建模。通过学习通过逐渐退化的图像监督的分辨率感知 Token 序列，细节流使生成过程从全局结构开始并逐步完善细节。这种粗到1D Token 的序列与自回旋推理机制很好地对齐，为AR模型生成复杂的视觉内容提供了一种更自然和有效的方式 ...

0 0 0 2025/06/20 arXiv:2505.21473v1 CoooolTu

SAL-PIM: A Subarray-level Processing-in-Memory Architecture with LUT-based Linear Interpolation for Transformer-based Text Generation

文本生成是自然语言处理的引人注目的子场，旨在从输入单词中生成可读的文本。特别是，仅解码器生成模型，例如生成预训练的 Transformer （GPT），广泛用于文本生成，具有两个主要的计算阶段：汇总和生成。与可以并行处理输入 Token 的汇总阶段不同，由于其顺序生成输出 Token ，生成阶段很难加速 ...

0 0 0 2025/06/20 arXiv:2401.17005v1 wangjun

DynamicKV: Task-Aware Adaptive KV Cache Compression for Long Context LLMs

LLMS中有效的KV高速缓存管理对于诸如抹布和摘要之类的长篇小说任务至关重要。现有的KV缓存压缩方法强制执行固定模式，忽略了特定于任务的特征并减少了基本信息的保留。但是，我们在各种任务中观察到跨层之间的不同激活模式，突出了对每个任务独特需求量身定制的自适应策略的需求 ...

0 0 0 2025/06/20 arXiv:2412.14838v4 mulanshine1

Graphusion: Leveraging Large Language Models for Scientific Knowledge Graph Fusion and Construction in NLP Education

知识图（kgs）在人工智能领域至关重要，并广泛应用于下游任务，例如增强问答（QA）系统。 KGS的建设通常需要域专家的巨大努力。最近，大型语言模型（LLM）已用于知识图构造（KGC），但是，大多数现有方法都集中在本地视角上，从而从单个句子或文档中提取知识三重态 ...

0 0 0 2025/06/20 arXiv:2407.10794v1 cella

Can LLMs be Good Graph Judge for Knowledge Graph Construction?

在现实场景中，从信息检索（IR）系统获得的大多数数据都是非结构化的。将自然语言句子转换为结构化知识图（KG）仍然是一个严峻的挑战。构建的知识图谱的质量也可能会影响一些依赖于知识图谱的领域（例如 GraphRAG 系统和推荐系统）的性能 ...

0 0 0 2025/06/19 arXiv:2411.17388v3 cella

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）