尽管大语言模型(LLMS)取得了重大进步,但推理模型的主要缺点是它们的巨大 Token 用法,从而增加了计算成本,资源需求和响应时间。在这项工作中,我们重新审视了增强学习的核心原则(RL),并通过数学分析表明,产生冗长响应的趋势本质上是源于训练过程中基于RL的优化。这一发现质疑了较长响应固有地提高推理准确性的普遍假设 ...
0 0 0 2025/04/14 arXiv:2504.05185v1 DioInRuc
许多现实世界的优化方案涉及昂贵的评估,其成本未知和异质成本。成本吸引的贝叶斯优化是应对这些挑战的重要解决方案。为了以具有成本效益的方式在有限预算内接近全球最佳,成本感知收购功能(AFS)的设计成为关键步骤 ...
0 0 0 2025/04/14 arXiv:2404.16906v2 bajibaji
由于4D磁共振成像(MRI)在识别心血管疾病中的血液动力学方面的准确性有限,因此获得患者特异性流动边界条件的挑战以及计算苛刻的计算流体动力学(CFD)模拟的计算苛刻和时间耗时的性质,因此可以探索这些新数据的限制,以探索这些新数据的限制。在目前的工作中,我们在3D腹部主动脉瘤(AAA)理想的模型中研究了物理知识的神经网络(PINN),深接操作员网络(PINN)及其物理信息扩展(PI-Deeponet ...
0 0 0 2025/04/14 arXiv:2503.17402v1 wgkooo
探索是扩大用户体验超出其既定偏好的行为,这是由于反馈循环和用户探索模式的信号有限而在大规模推荐系统中挑战。大型语言模型(LLM)通过利用其世界知识推荐这些循环以外的新内容来发挥潜力。一个关键的挑战是将LLM与用户偏好保持一致,同时保留其知识和推理 ...
0 0 0 2025/04/14 arXiv:2504.05522v1 Cye
我们按照Blackwell-Dubins定理的方式来表征Martin-Löf随机性和schnorr随机性。在设置了定义合并随机性概念的一般框架之后,我们专注于有限的地平线事件,即从Kalai-Lehrer的意义上进行薄弱的合并。与Blackwell-Dubins和Kalai-Lehrer相反,我们不仅考虑了总变分距离,还考虑了Hellinger距离和Kullback-Leibler差异 ...
0 0 0 2025/04/14 arXiv:2504.00440v1 Cye
大规模的,弱监督的语音识别模型(例如Whisper)在跨领域和语言的语音识别方面表现出了令人印象深刻的结果。但是,它们通过缓冲或滑动窗口的方法应用于长音频转录,容易出现漂移,幻觉和重复。并禁止由于其顺序性质而导致的批处理转录。此外,时间戳对应的每种话语都容易出现不准确,并且单词级的时间戳不可用 ...
0 0 0 2025/04/14 arXiv:2303.00747v2 13724122396
建模心血管解剖学对它们的复杂,不规则的结构和固有的病理状况构成了重大挑战。数值模拟虽然准确,但通常在计算上很昂贵,从而限制了它们在临床环境中的实用性。另一方面,传统的机器学习方法经常在一些重大障碍(包括投入的高维度)上挣扎,无法有效与不规则的网格合作,并保留了动态问题中响应的时间依赖性 ...
0 0 0 2025/04/14 arXiv:2503.17505v1 wgkooo
组合优化问题通常依靠启发式算法来生成有效的解决方案。但是,启发式方法的手动设计是资源密集型的,并且受设计师的专业知识的限制。人工智能的最新进展,尤其是大型语言模型(LLM),已经证明了通过进化框架自动化启发式生成的潜力 ...
0 0 0 2025/04/14 arXiv:2503.03350v1 bajibaji

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)