大型语言模型(LLM)表现出了令人印象深刻的功能,并且正在受到越来越多的关注,以通过缩放测试时间计算来增强其推理。但是,他们在公开的知识中的应用仍然有限。由于对完整世界知识的隐性假设,推理 - 面向的方法很难概括为开放 ...
0 0 0 2025/06/01 arXiv:2504.10893v2 jueli
检测超伴侣关系是NLP中的关键任务,在文献中使用两种互补方法解决了这一点。分配方法的监督变体是当前最佳性能的人,也是基于路径的方法,受到研究的关注较少。我们建议一种改进的基于路径的算法,其中使用复发性神经网络编码依赖性路径,从而实现了与分布方法相当的结果 ...
0 1 0 2025/06/01 arXiv:1603.06076v3 stringify
我们提出了一种新的方法来检测大型语言模型(LLM)中的名词抽象。从分类学关系中的一组心理动机的名词对开始,我们实例化表面表明超呼气,并分析BERT产生的注意力矩阵。我们将结果与两组反事实相提并论,并表明我们可以在抽象机制中检测到超呼气,这与名词对的分布相似性不完全相关 ...
0 0 0 2025/06/01 arXiv:2404.15848v2 stringify
最先进的3D语义细分模型在现成的公共基准测试中进行了培训,但是当将这些经过良好训练的模型部署到新领域时,它们将不可避免地面临识别精度下降的挑战。在本文中,我们引入了一个统一的域自适应3D语义分割管道(UNIDA3D),以增强弱的概括能力,并弥合域之间的点分布差距。与以前仅关注单个适应任务的研究不同,UNIDA3D可以通过设计统一的源和目标主动采样策略来解决3D分割领域中的几个适应任务,该采样策略从 ...
0 0 0 2025/06/01 arXiv:2212.10390v4 尼斯湖
基于深度学习的知识追踪模型已显示出胜过传统知识追踪模型而无需进行人工设计的特征,但长期以来,它的参数和表示因无法解释而受到批评。在本文中,我们提出了深色的综合,这是项目响应理论(IRT)模型和知识追踪模型的综合,该模型基于深层神经网络体系结构,称为动态键值记忆网络(DKVMN),以使基于深度学习的知识跟踪可以解释。具体来说,我们使用DKVMN模型来处理学生的学习轨迹,并估算学生能力水平和随时间推移 ...
0 0 0 2025/06/01 arXiv:1904.11738v1 Yiyi5946
由于数字人类的不断出现的需求,从给定的动作描述生成真实的人体动作已经取得了显着的进步。虽然最近的工作在直接从文本动作描述生成运动方面取得了令人印象深刻的成果,但它们通常仅支持单一模式的控制信号,这限制了它们在真正的数字人类行业中的应用。本文提出了一种运动通用发生器(MotionGPT),它可以使用多模态控制信号,例如 ...
0 0 0 2025/06/01 arXiv:2306.10900v2 parsifalster
3D感知表示非常适合机器人操纵,因为它们很容易编码闭塞并简化空间推理。许多操纵任务都需要末端效果姿势预测中的高空间精度,这通常需要高分辨率3D特征网格的计算昂贵的处理。结果,大多数操纵策略直接在2D中运行,前面是3D电感偏见 ...
0 0 0 2025/06/01 arXiv:2306.17817v2 kkkk
现实世界中的数据生成通常涉及实例之间复杂的相互依存关系,违反了标准学习范式的IID数据假设,并为发现学习所需实例表示的几何结构带来了挑战。为此,我们引入了一个能量约束的扩散模型,该模型将数据集从数据集编码一批实例中,这些实例逐渐通过其交互逐渐合并了其他实例的信息。扩散过程受到下降标准w的约束 ...
0 0 0 2025/06/01 arXiv:2301.09474v4 re-spurs

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)