一译 —— 文档和论文翻译、对照阅读、讨论和社区

Deep Knowledge Tracing with Learning Curves

知识追踪（KT）最近是计算教学法的积极研究领域。任务是根据他们过去对问题的回答来对学生的掌握知识概念的掌握水平进行建模，并预测他们将来正确回答后续问题的概率。历史上使用统计建模方法（例如贝叶斯推理和因素分析）解决了KT任务，但是深度学习的最新进展导致了连续的建议，这些建议利用了深层的神经网络，包括长期短期记忆网络，记忆启动的网络和自我意见网络 ...

0 0 0 2025/07/18 arXiv:2008.01169v2 bestenevoy

ROS-SAM: High-Quality Interactive Segmentation for Remote Sensing Moving Object

大规模遥感视频数据的可用性强调了高质量交互式分割的重要性。但是，诸如小物体大小，模棱两可的特征和有限的概括之类的挑战使得当前方法难以实现此目标。在这项工作中，我们提出了ROS-SAM，这种方法旨在实现高质量的交互式分割，同时保留跨不同遥感数据的概括 ...

0 0 0 2025/07/18 arXiv:2503.12006v1 SGN001

THUD++: Large-Scale Dynamic Indoor Scene Dataset and Benchmark for Mobile Robots

大多数现有的移动机器人数据集主要捕获静态场景，从而限制了其在动态环境中评估机器人性能的实用程序。为了解决这个问题，我们提出了一个面向移动机器人的大规模室内数据集，称为Thud ++（Tsinghua University Dynamic）机器人数据集，以进行动态场景的理解。我们当前的数据集包括13个大规模动态场景，将现实世界和合成数据分别与真实的机器人平台和物理模拟平台相结合 ...

0 0 0 2025/07/18 arXiv:2412.08096v1 weanhear

DrivingRecon: Large 4D Gaussian Reconstruction Model For Autonomous Driving

街头场景的感性4D重建对于在自动驾驶中开发现实世界中的模拟器至关重要。但是，大多数现有方法脱机执行此任务，并依靠时必的迭代过程，从而限制了其实际应用。为此，我们介绍了一个大型的4D高斯重建模型（DriveRecon），这是一种可推广的驾驶场景重建模型，该模型直接从环绕视频视频中预测4D高斯 ...

0 0 0 2025/07/18 arXiv:2412.09043v1 orangelcx

Rethinking Agent Design: From Top-Down Workflows to Bottom-Up Skill Evolution

大多数基于LLM的代理框架都采用自上而下的哲学：人类分解任务，定义工作流程并分配代理人执行每个步骤。尽管对基准式任务有效，但此类系统依靠设计师的更新和忽略了代理商从经验中学习的潜力。最近，Silver和Sutton（2025）想到了进入一个新时代的转变，在那里，代理商可以从经验中进步 ...

0 1 0 2025/07/18 arXiv:2505.17673v1 hzx719

Integrating Learning-Based Manipulation and Physics-Based Locomotion for Whole-Body Badminton Robot Control

基于学习的方法，例如模仿学习（IL）和增强学习（RL），可以在挑战性敏捷的机器人任务（例如运动机器人）上制定Excel控制政策。但是，没有现有的工作将基于学习的政策与基于模型的方法协调，以降低训练的复杂性并确保敏捷羽毛球机器人控制的安全性和稳定性。在本文中，我们介绍了敏捷羽毛球机器人的新型混合控制系统Hamlet ...

0 0 10 2025/07/18 arXiv:2504.17771v2 DogmaB

Nemotron-CC: Transforming Common Crawl into a Refined Long-Horizon Pretraining Dataset

最近的 English Common Crawl 数据集（例如 FineWeb-Edu 和 DCLM）通过积极的基于模型的过滤取得了显着的基准收益，但代价是删除了 90% 的数据。这限制了它们对长 Token 范围训练的适用性，例如 Llama 3.1 的 15T  Token  ...

0 0 0 2025/07/18 arXiv:2412.02595v2 lianzhepku

VEM: Environment-Free Exploration for Training GUI Agent with Value Environment Model

通过增强学习（RL）面临关键挑战的图形用户界面（GUI）代理的培训视觉模型（VLM）：基于环境的RL需要昂贵的互动，而环境无环境方法则在分配转移和奖励概括方面挣扎。我们提出了一个无环境的RL框架，该框架通过利用预验证的价值环境模型（VEM）来将价值估计与策略优化分解。 VEM可以直接从离线数据预测状态行动值，从而在不需要下一州的预测或环境反馈的情况下将类似人类的人的先验提炼 ...

0 0 0 2025/07/18 arXiv:2502.18906v1 JackeyGuo

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）