现在,异类多核是现代计算系统的组成部分,从嵌入式系统到超级计算机。虽然异质的多核设计为节能高性能提供了潜力,但只有在应用程序合理地平行并可以与基本的异构平台匹配时,这种潜力才能解锁。在本文中,我们为异构多核体系结构的并行编程模型提供了全面的调查,并回顾了提高可编程性和可移植性的编译技术 ...
0 0 0 2025/06/14 arXiv:2005.04094v1 happygzl
基于多模式LLM的代理(MLA)的出现通过无缝整合视觉,语言,动作和动态环境,从而改变了交互范式,从而促进了从Web自动化到移动系统范围内的GUI应用程序前所未有的自主功能。但是,MLA引入了关键的可信度挑战,远远超出了传统语言模型的局限性,因为它们可以直接修改数字状态并触发不可逆转的现实世界后果。现有的基准不足以应对MLAS的可行输出,长途不确定性和多模式攻击向量所带来的这些独特挑战 ...
0 0 0 2025/06/14 arXiv:2506.01616v1 hhhhh
我们调查了随着时间的流逝,文本到图像生成模型的偏见趋势,重点是通过拥抱面(例如拥抱面)的模型增加。尽管这些平台使AI民主化,但它们还促进了固有的偏见模型的传播,通常是由特定于任务的微调塑造的。确保道德和透明的AI部署需要强大的评估框架和可量化的偏见指标 ...
0 0 0 2025/06/14 arXiv:2503.08012v1 cella
在本文中,我们为通用零击目标导航提供了一个通用框架。现有的零击方法在大型语言模型(LLM)上为特定任务构建推理框架,这在整体管道上有很大不同,并且无法跨越不同类型的目标。为了实现通用零射击导航的目的,我们提出了一个统一的图表表示,以统一不同的目标,包括对象类别,实例图像和文本描述 ...
0 0 0 2025/06/14 arXiv:2503.10630v3 Alice_ly
引用视频对象细分(RVO)需要根据给定的自然语言表达式在视频中跟踪和分割对象,要求复杂的运动理解和视觉表示与语言描述的对齐。鉴于这些挑战,最近提出的任何模型2(SAM2)成为潜在候选者,因为它能够在视频框架上生成相干分割掩码轨道,并在其对象 Token 表示中提供固有的时空暂时性对象。在本文中,我们介绍了Sola(按对象语言对齐方式选择),这是一个利用SAM2对象 Token 作为紧凑的视频级对象 ...
0 0 0 2025/06/14 arXiv:2412.01136v2 chengwenxuan7
llm讨论的最新进展表明,llm的推理能力。在这项工作中,我们通过系统实验重新评估了这一主张,提出了一种新颖的小组讨论框架来丰富讨论机制。有趣的是,我们的结果表明 ...
0 0 0 2025/06/14 arXiv:2402.18272v1 nvihow
现有的单发4D头合成方法通常借助于3DMM重建,从单眼视频中学习,但是后者却具有挑战性的挑战,这限制了它们免于合理的4D头部合成。我们提出了一种通过大规模合成数据学习单发4D头合成的方法。关键是首先通过对抗性学习从单眼图像中学习一个部分的4D生成模型,以合成各种身份的多视图图像,并将完整动作作为培训数据;然后利用基于 Transformer 的动画三重式重建器使用合成数据学习4D头重建 ...
0 0 0 2025/06/14 arXiv:2311.18729v2 ReLU
\ ac {rag}已成为一种至关重要的技术,用于增强具有实时和域特异性知识的大型模型。尽管已经提出了许多改进和开源工具来完善\ ac {rag}框架的准确性,但对提高产生结果的可信度的关注很少。为了解决这一差距,我们介绍了Trustrag,这是一个新颖的框架,从三个角度:索引,检索和世代增强\ ac {rag} ...
0 0 0 2025/06/14 arXiv:2502.13719v1 anine

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)