wgkooo的文档

wgkooo

个性签名 ...

Context Compression for Auto-regressive Transformers with Sentinel Tokens

注意力模块的二次复杂度使其在生成过程中逐渐成为基于 Transformer 的 LLM 中的计算量。此外，处理长输入时出现的过多键值缓存也会带来严重的内存占用和推理延迟问题。在这项工作中，我们提出了一种即插即用的方法，能够将指定范围的 Token 的中间激活增量压缩为紧凑的 Token ，从而在处理后续上下文时减少内存和计算成本 ...

0 1 0 0 2024/03/22 arXiv:2310.08152v2 wgkooo

Cognate Transformer for Automated Phonological Reconstruction and Cognate Reflex Prediction

音系重建是历史语言学的核心问题之一，其中祖先语言的原词是根据观察到的子代语言的同源词确定的。历史语言学的计算方法试图通过学习可用语言数据的模型来自动化任务。从计算生物学中汲取的一些思想和技术已成功应用于计算历史语言学领域 ...

0 1 0 0 2024/03/22 arXiv:2310.07487v2 wgkooo

Accelerating Transformer Inference for Translation via Parallel Decoding

自回归解码限制了机器翻译（MT）转换器的效率。社区提出了特定的网络架构和基于学习的方法来解决这个问题，但这些方法成本高昂，并且需要更改机器翻译模型，以牺牲翻译质量为在本文中，我们从解码算法的角度来解决这个问题，这是一个看似解决的探索，但引人注目的方向...... ...

0 1 0 0 2024/12/26 arXiv:2305.10427v1 wgkooo

A Length-Extrapolatable Transformer

位置建模在《变形金刚》中发挥了至关重要的作用。在本文中，我们关注长度外推，即... ...

0 1 0 0 2024/10/23 arXiv:2212.10554v1 wgkooo

Context Compression for Auto-regressive Transformers with Sentinel Tokens

Cognate Transformer for Automated Phonological Reconstruction and Cognate Reflex Prediction

Accelerating Transformer Inference for Translation via Parallel Decoding

A Length-Extrapolatable Transformer

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您在阅读时勇敢地改正翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）