大型语言模型(LLM)需要在推理时进行大量计算,从而能量。虽然量化权重和激活有效提高效率,但由于幅度较大的离群值,LLM的天真量化可以显着降低性能。本文介绍了FPTQuant,它介绍了四个新颖,轻巧和表达功能的具有功能的变换(FPT),以促进变形金刚的量化:(1)可查询和钥匙的可合并的前索引变换,(2)值的值转换,(2)值的价值变换,(3)MLP块内和(4)在MLP块中的合并规模变换,并且(4)廉 ...
0 0 0 2025/06/06 arXiv:2506.04985v1 felixslu
最近的研究从经验上表明,语言模型(LMS)编码仅仅是语义之外的丰富世界知识,从而引起了各个领域的重要关注。但是,在建议域中,LMS是否隐式编码用户偏好信息仍然不确定。与普遍的理解相反,由于语言和行为建模目标的巨大差距,LMS和传统推荐人学习了两个不同的表示空间,因此此工作重新检查了理解并探索直接从语言表示空间中提取建议空间的理解 ...
0 0 0 2025/06/06 arXiv:2407.05441v4 RrsTang
最近的体现药物主要是基于强化学习(RL)或大语言模型(LLMS)构建的。其中,RL代理可以有效地部署,但仅执行很少的任务。相比之下,巨型LLM代理(通常超过1000b参数)具有强大的概括,同时要求巨大的计算资源 ...
0 0 0 2025/06/06 arXiv:2405.17424v2 chrisxiong
工具集成推理(TIR)增强了具有调用外部工具(例如搜索引擎和代码解释者)的能力的大型语言模型(LLMS),以解决超出仅语言推理功能的任务。尽管增强学习(RL)通过优化最终答案正确性表明了在改善TIR方面的希望,但现有方法通常会忽略与工具使用相关的效率和成本。这可能会导致次优行为,包括增加计算和财务开销的工具呼叫,或不足的工具使用损害答案质量的工具 ...
0 0 0 2025/06/06 arXiv:2504.14870v2 gfsadasaf
基于公制的少量学习方法集中于学习可转移的功能嵌入,从可见类别概述到在有限的标记实例的监督下,从可见类别到看不见的类别。但是,他们中的大多数人分别在工作环境中分别对待每个实例,而无需考虑其与他人的关系。在这项工作中,我们研究了一种新的度量学习方法,即记忆增强的关系网络(MRN),以明确利用这些关系 ...
0 0 0 2025/06/06 arXiv:2005.04414v2 张小平
障碍物检测是机器人导航中的一个安全问题,即立体声匹配是一种流行的基于视觉的方法。尽管深度神经网络在计算机视觉中显示出令人印象深刻的结果,但以前的大多数障碍物检测都仅利用传统的立体声匹配技术来满足实时反馈的计算限制。本文提出了一种计算高效的方法,该方法采用了深层神经网络直接从立体声图像中检测占用率 ...
0 0 0 2025/06/06 arXiv:2209.08459v2 15528091895
Teleperation是体现机器人学习的基石,尤其是双人灵式远程操作提供了丰富的演示,这些演示很难通过完全自主的系统来获得。尽管最近的研究提出了从惯性运动捕获手套到外骨骼和基于视觉的界面的多种硬件管道,但仍然没有统一的基准测试,可以对这些系统进行公平,可重复的比较。在本文中,我们介绍了Teleopbench,这是一种以模拟器为中心的基准测试,该基准量身定制了双人灵活的远程处理 ...
0 0 0 2025/06/06 arXiv:2505.12748v1 wchiyu98
与人类直接执行任务相比,在远程操作的任务完成时间方面的任务绩效仍然远远落后。对此的一个很大的确定影响是人类执行转换和对齐的能力,这直接受到观点和运动重新定位策略的影响。在现代远程操作系统中,通常通过一次性校准或切换模式实现运动重新定位 ...
0 0 0 2025/06/06 arXiv:2505.13054v1 wchiyu98

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)