随着大型语言模型(LLM)的发展,优化硬件使用量并改善吞吐量已经变得越来越重要。在本文中,我们研究了部署LLM的服务系统的推理优化。为了优化系统吞吐量并最大化硬件利用率,我们将推理优化问题作为混合智能编程(MIP)模型,并提出一种混合脱机方式作为解决方案 ...
0 0 0 2025/03/05 arXiv:2502.15763v1 lzyrapx
视觉混合物将元素从两个不同的视觉概念结合到一个单一的集成图像中,目的是通过富有想象力且经常发人深省的视觉效果传达思想。通过视觉混合传达抽象概念带来了一系列概念和技术挑战。为了应对这些挑战,我们介绍了创意混合物,这是一种AI辅助设计系统,该系统利用隐喻来视觉象征抽象概念通过混合不同的对象 ...
0 0 0 2025/03/05 arXiv:2502.16062v1 qiuyan
时间序列分类(TSC)极易受到后门攻击的影响,构成了重大的安全威胁。现有方法主要集中于训练阶段的数据中毒,设计了复杂的触发器以提高隐形和攻击成功率(ASR)。但是,在实际情况下,攻击者经常在访问培训数据时面临限制 ...
0 0 0 2025/03/05 arXiv:2502.00646v1 zzr123456
最近,多模式的大语言模型(MLLM)表现出强烈的视觉理解和决策能力,从而探索了在未知环境中自主改善MLLM的探索。但是,外部反馈(例如人类或环境反馈)并不总是可用。为了应对这一挑战,现有的方法主要集中于通过投票和评分机制增强MLLM的决策能力,而在改善未知环境中MLLM的环境理解方面几乎没有付出努力 ...
0 0 0 2025/03/05 arXiv:2410.03303v1 蔡明方
潜在的3D重建在赋予3D语义理解和3D生成方面表现出巨大的希望,这是通过将2D特征提炼到3D空间中的。但是,现有的方法与2D特征空间和3D表示之间的域间隙困难,从而导致渲染性能下降。为了应对这一挑战,我们提出了一个新颖的框架,将3D意识集成到2D潜在空间中 ...
0 0 0 2025/03/05 arXiv:2502.09613v1 wonglliam
大型语言模型已成为推荐系统中功能增强的强大方法。但是,依靠快速推理的现有方法通常会遭受功能描述中不完整的特征覆盖范围和不足的特异性,从而限制了它们捕获细粒用户偏好的能力并破坏整体性能。在数学和编码任务中推断扩展的最新成功的激励之中,我们探讨了缩放推理是否可以解决这些局限性并提高功能质量 ...
0 0 0 2025/03/05 arXiv:2502.16040v1 Merlin_Wong
由大语言模型(LLM)提供动力的对话代理在各种任务中表现出卓越的性能。尽管用户理解和类似人类的反应有更好的选择,但它们缺乏可控性仍然是一个关键挑战,通常会导致不关注的对话或任务失败。为了解决这个问题,我们介绍标准操作程序(SOP)以调节对话流程 ...
0 0 0 2025/03/05 arXiv:2407.03884v3 arthur0222
由于大型语言模型(LLM)在许多领域和任务中展示了其强大的能力,包括上下文理解,代码生成,语言生成,数据讲故事等,许多数据分析师可能会引起人们的担忧,如果他们的工作将被人工智能(AI)取代。这个有争议的话题引起了公众的极大关注 ...
0 0 0 2025/03/05 arXiv:2305.15038v2 大红豆

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)