具有数千亿参数的大型语言模型 (LLM) 需要强大的服务器级 GPU 进行推理,限制了其实际部署。为了应对这一挑战,我们引入了异常值感知权重量化(OWQ)方法,该方法旨在通过低精度表示来最小化 LLM 的足迹。 OWQ 优先考虑对量化敏感的一小部分结构化权重,以高精度存储它们,同时对剩余的密集权重应用高度调谐的量化 ...

0 0 1 12 2024/10/13 arXiv:2306.02272v4 sjh

去噪扩散概率模型 (DDPM) 已在各个领域的数据生成中广受欢迎。然而,一个重要的瓶颈是生成过程的每一步都需要进行全网络计算,从而导致较高的计算开销。本文提出了一种新颖的框架,即去噪扩散步进感知模型(DDSM)来应对这一挑战 ...

0 0 0 0 2024/10/13 arXiv:2310.03337v5 lioi

我们证明,通过使用非常粗糙的晶格,晶格 QCD 计算可以加快 10^3$--10^6$ 倍。为了获得准确的结果,我们用扰动改进的动作替换了标准的晶格动作,并使用蝌蚪改进的校正项来消除由于晶格引起的前导误差。为了说明这种方法的威力,我们使用台式计算机计算静态夸克势、粲素谱和波函数 ...

0 0 0 0 2024/10/13 arXiv:hep-lat/9507010v3 kahsisjdhdkd

随着 5G 技术的日益成熟,人们对 6G 的期望也越来越高,它有望通过尖端的无线电技术提供更快、更可靠的无线连接。然而,对这些无线电技术部署的大规模天线阵列的有效管理方法至关重要。传统的管理方法主要是反应式的,通常根据用户的反馈来适应动态的无线信道 ...

0 0 0 0 2024/10/13 arXiv:2401.08023v1 Urleaves

交通预测是智能交通系统(ITS)范围内的一个关键方面,实现高精度预测对于有效的交通管理具有深远的意义。流行的深度学习驱动的流量预测模型的精度通常会随着训练数据量的增加而呈上升趋势。然而,获取全面的交通时空数据集通常充满挑战,主要源于与数据收集和保留相关的巨额成本 ...

0 0 0 0 2024/10/13 arXiv:2403.02221v2 HeiHuZi

准确的行人轨迹预测对于各种应用至关重要,并且需要深入了解动态环境中的行人运动模式。然而,现有的行人轨迹预测方法仍然需要更多的探索才能充分利用这些运动模式。本文研究了使用大型语言模型(LLM)通过引入运动线索来改进行人轨迹预测任务的可能性 ...

0 0 0 0 2024/10/13 arXiv:2403.08032v1 HeiHuZi

人类动作识别 (HAR) 是计算机视觉和人工智能的关键研究领域,RGB 相机是该领域研究和创新的首选工具。然而,在现实应用中,RGB 相机遇到了许多挑战,包括光照条件、快速运动和隐私问题。因此,仿生事件相机因其低能耗、高动态范围等优点而受到越来越多的关注 ...

0 0 0 0 2024/10/13 arXiv:2408.09764v1 dabanqiao

图神经网络(GNN)计算同态的能力最近被提出作为其表达能力的实用且细粒度的度量。尽管现有的一些工作已经研究了某些 GNN 系列的同态计数能力,但缺乏一个简单且统一的框架来分析该问题。在本文中,我们首先提出 \emph{广义民间传说 Weisfeiler-Leman (GFWL)} 算法作为表达 GNN 的灵活设计基础,然后提供一个理论框架来通过算法确定任意类 GNN 的同态计数能力GFWL 设计空间 ...

0 0 0 0 2024/10/13 arXiv:2410.03517v1 yeyuyan

最近,大规模预训练视觉语言模型(例如 CLIP)由于其强大的代表性能力而引起了广泛关注 ...

0 0 0 0 2024/10/13 arXiv:2408.10688v1 dabanqiao

以类似于人类探索的方式实现完全开放的语言目标并探索开放场景始终面临着重大挑战。最近,视觉大语言模型(VLM)在语言和视觉数据推理方面表现出了卓越的能力。虽然许多工作都集中于利用 VLM 在开放场景和开放词汇中进行导航,但这些努力往往无法充分利用 VLM 的潜力或需要大量计算资源 ...

0 0 0 0 2024/10/13 arXiv:2410.02787v1 Lingzhi

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)