由于缺乏将音频信号与以推理为导向的文本分析相结合的高质量多模式训练数据,因此对电信欺诈的检测面临重大挑战。为了解决这一差距,我们提出了Teleantifraud-28K,这是第一个专门为自动电信欺诈分析设计的开源音频 - 文本慢思维数据集。我们的数据集是通过三种策略来构建的:(1)使用自动语音识别(ASR)转录的呼叫记录(带有匿名的原始音频)的隐私文本真实示例生成,从而确保通过文本对语音(TTS) ...
0 0 0 2025/05/13 arXiv:2503.24115v3 kbwzy
最近的研究表明,大型语言模型(LLMS)可以利用低精确的浮点(FP)量化来提供高效率,同时保持原始模型的准确性。特别是,最近的作品表明了非电力精度(例如FP6和FP5)的有效性,以及对LLM层的低精度算术的敏感性,这激励了混合精度算术,包括LLMS中的非功率 - 两个精度。尽管低精度算法从较低的计算开销中导致了低计算的开销,但由于硬件约束支持有限的两个精度,因此无法完全利用此类好处(e ...
0 0 0 2025/05/13 arXiv:2411.18065v1 jane88
使用更多数据,计算和参数缩放语言模型已推动了自然语言处理的重大进展。例如,由于扩展,GPT-3能够在内在学习任务上取得强大的结果。但是,培训这些大型密集的模型需要大量的计算资源 ...
0 0 0 2025/05/13 arXiv:2112.06905v2 anhao
图形神经网络(GNN)在各种与图形相关的任务上非常有效。但是,它们缺乏解释性和透明度。当前的解释性方法通常是局部的,并且将GNN视为黑盒。他们不在模型内部看,抑制了人类对模型和解释的信任 ...
0 0 0 2025/05/13 arXiv:2208.10609v2 amazz
乘法是现代神经网络(NN)计算中的核心操作,对能源消耗产生了重大贡献。线性复杂性乘法(L-MUL)算法被专门作为新兴NN模型(例如大语言模型(LLM))的近似乘法方法,以降低乘法的能量消耗和计算复杂性。但是,尚未报道针对L-MUL的硬件实施设计 ...
0 0 0 2025/05/13 arXiv:2412.18948v1 jane88
如今,数据由向量表示。在数百万和数十亿中,检索与给定查询相似的媒介是一个无处不在的问题,被称为相似性搜索,与广泛的应用相关。基于图的指数是目前用于数十亿级相似性搜索的最佳性能技术 ...
0 0 0 2025/05/13 arXiv:2304.04759v2 李大人
这项调查探讨了推理大语言模型(LLMS)的最新进步,该模型旨在模仿“缓慢思考”,这是一个受人类认知启发的推理过程,如卡恩曼的思想中所述,快速而慢。这些模型,例如OpenAI的O1,专注于在复杂任务中动态扩展计算资源,例如数学推理,视觉推理,医学诊断和多代理辩论。我们介绍了推理LLM的发展,并列出了其关键技术 ...
0 0 0 2025/05/13 arXiv:2505.02665v2 tea5
随着对计算缩放计算(数据和参数)的热情逐渐减少,测试时间缩放(TTS),也称为``测试时间计算''的热情已成为一个突出的研究重点。最近的研究表明,TTS可以进一步引起大语模型(LLM)的解决问题的能力,这不仅可以在专门的推理任务(例如数学和编码)中进行重大突破,还可以在开放式Q&A等一般任务中进行。但是,尽管最近在这一领域努力爆炸了,但仍需要进行全面了解的全面调查 ...
0 0 0 2025/05/13 arXiv:2503.24235v3 hongquw

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)