现有的3D实例分割方法经常遇到过度分割的问题,导致冗余和不准确的3D建议使下游任务复杂化。这一挑战是由他们无监督的合并方法引起的,在该方法中,密集的2D实例掩膜在跨框架中抬起到点云中,以不直接监督而形成3D候选建议。然后,这些候选者根据启发式标准将这些候选者层次合并,通常会导致许多冗余细分未能合并为精确的3D建议 ...
0 0 0 2025/06/03 arXiv:2411.16183v1 gonghaibin
通过嵌入模型构建网络中节点的潜在矢量表示已显示其在许多图形分析应用程序中的实用性,例如节点分类,聚类和链接预测。但是,尽管学习嵌入模型的效率和准确性很高,但人们对嵌入矢量保留了有关原始网络的哪些信息几乎没有线索。低维矢量表示,施工过程的随机性质和非透明性超参数的抽象性均模糊了对网络嵌入结果的理解 ...
0 0 0 2025/06/03 arXiv:1808.09074v1 saya
夜间无人机跟踪利用弱光增强和域的适应性,取得了长足的进步。但是,过度依赖图像增强,有限的高质量夜间数据以及白天和夜间跟踪器之间缺乏集成阻碍了端到端可训练的框架的开发。此外,由于当前基于VIT的跟踪器需要大量的计算资源,因为它们依赖自我发挥机制 ...
0 0 0 2025/06/03 arXiv:2412.00626v3 bin
由于缺乏高质量、特定的数据,合成数据已成为大型语言模型 (LLM) 训练后任务的关键资源。尽管已经开发了各种方法来生成合成数据,但合成数据的实际效果与我们的理论理解之间仍然存在明显的差距。为了应对这一挑战,我们首先对流行的合成数据生成过程进行详细建模 ...
0 0 0 2025/06/03 arXiv:2410.01720v3 读论文123
知识跟踪(KT)是智能辅导系统的核心组成部分,对学习者的知识状态进行建模以预测未来的表现并提供个性化的学习支持。传统的KT模型假设学习者的学习能力在短时间内保持相对稳定,或者根据先前的表现的可预测方式变化。但是,实际上,由于认知疲劳,动机和外部压力等因素,学习者的能力不规则地改变了 - 我们将其称为实时学习模式调整(RLPA) ...
0 0 0 2025/06/03 arXiv:2505.19543v1 Shylie
我们引入了VidlPro,这是一种专门为机器人和腹腔镜手术设计的新型视频语言(VL)预训练框架。尽管现有的手术VL模型主要依赖于对比度学习,但我们提出了一种更全面的方法来捕获复杂的时间动力学并与语言保持一致。 VidlPro集成了视频文本对比学习,视频文本匹配和蒙版语言建模目标,以学习丰富的VL表示 ...
0 0 0 2025/06/03 arXiv:2409.04732v2 663138597
以推理为中心的语言模型的最新进展突出了增强学习(RL),作为将模型与可验证奖励保持一致的有前途的方法。但是,RL是真正扩展模型的推理功能还是仅仅放大基本模型分布中已经潜在的高回报输出,以及是否不断扩大RL计算会可靠地导致推理性能提高,这仍然是有争议的。在这项工作中,我们通过证明延长的RL(PRORL)培训可以发现基本模型无法访问的新型推理策略,即使在广泛的采样中也无法访问,我们可以挑战普遍的假设  ...
0 0 0 2025/06/03 arXiv:2505.24864v1 chrisxiong
最近,DeepSeek-R1(例如DeepSeek-R1)等深层推理大型语言模型(LLM)在数学和编码等任务中取得了重大进展。受到这一点的启发,一些研究采用了加强学习(RL)来增强模型的深层推理能力并提高机器翻译(MT)质量。但是,术语翻译是MT中的重要任务,在深度推理LLM中仍未探索 ...
0 0 0 2025/06/02 arXiv:2505.21172v1 ChenSF1998

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)