语言建模的最新进展显着改善了深神经模型的生成能力:2019年OpenAI释放了GPT-2,这是一种预先训练的语言模型,可以自主生成连贯的,非平底和类似人类的文本样本。从那时起,已经开发了更强大的文本生成模型。对手可以利用这些巨大的生成能力来增强社交机器人,这些社交机器人将有能力写出合理的深击信息,希望污染公众的辩论 ...
0 0 0 2025/04/16 arXiv:2008.00036v2 15966829631
大型语言模型(LLM)正在成为自动加固学习(RL)奖励设计的有前途的工具,这是由于它们在常识性推理和代码生成中的强大功能。通过与RL代理进行对话,LLM通过选择相关环境状态并定义其内部操作来构建奖励观察空间(ROS)。但是,现有的框架并未有效利用历史探索数据或手动任务描述来迭代地发展该空间 ...
0 0 0 2025/04/16 arXiv:2504.07596v2 leec
从车内摄像机捕获的拥挤观察中揭示一条空旷的街道对于自动驾驶至关重要。但是,删除所有暂时的静态物体,例如停止的车辆和站立行人,提出了重大挑战。与以对象为中心的3D插入式介绍不同,这依赖于在一个小场景中进行详尽的观察,街道场景案例涉及与以前3D授课任务不同的长轨迹 ...
0 0 0 2025/04/16 arXiv:2405.18416v3 zsh231264
我们在机器翻译迁移学习的背景下研究 Transformer 架构中交叉注意力的力量,并将研究结果扩展到从头开始训练时的交叉注意力。我们通过对源语言或目标语言发生变化的数据微调翻译模型进行了一系列实验。这些实验表明,仅微调交叉注意力参数几乎与微调所有参数一样有效(即 ... ...
0 0 0 2025/04/16 arXiv:2104.08771v2 pdssunny
扩散模型在生成逼真图像方面取得了显着的成功,但在生成准确的人手方面存在问题,例如手指计数不正确或形状不规则。这一困难源于从训练图像中学习手的物理结构和姿势的复杂任务,其中涉及广泛的变形和遮挡。为了正确生成手部,我们的论文引入了一种名为 $\textbf{HandRefiner}$ 的轻量级后处理解决方案 ...
0 0 0 2025/04/16 arXiv:2311.17957v2 三十三
3d编辑在游戏和虚拟现实等许多领域发挥着至关重要的作用。传统的3d编辑方法依赖于网格和点云等表示形式,通常无法真实地描绘复杂的场景。另一方面,基于隐式3d表示的方法(例如神经辐射场(nerf))可以有效渲染复杂场景,但处理速度慢且对特定场景区域的控制有限... ...
0 0 0 2025/04/16 arXiv:2311.14521v4 Zhangsijia
我们探讨了一种进化搜索策略,用于扩展推理时间在大语言模型中计算。提出的方法,思维进化,使用语言模型来产生,重组和完善候选人的反应。提出的方法避免了每当有解决方案评估器可用时,需要正式化基础推理问题 ...
0 0 0 2025/04/16 arXiv:2501.09891v1 leec
当前的车辆到所有设施(V2X)系统使用LIDAR和相机数据显着增强了3D对象检测。但是,这些方法在不利天气条件下遭受性能降解。天气风光4D雷达提供多普勒和其他几何信息,从而提高了应对这一挑战的可能性 ...
0 0 0 2025/04/16 arXiv:2411.08402v4 ttt

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)