一译 —— 文档和论文翻译、对照阅读、讨论和社区

Portrait4D-v2: Pseudo Multi-View Data Creates Better 4D Head Synthesizer

在本文中，我们提出了一种新颖的学习方法，用于馈入4D头部化合物合成。与经常从3DMM指导的单眼视频中学习的现有方法不同，我们采用伪多视频视频来以数据驱动的方式学习4D头部合成器，从而避免依赖于不准确的3DMM重建，这可能是对合成性能是有害的。关键的想法是首先使用合成多视图图像学习3D头部合成器，以将单眼真实视频转换为多视频，然后利用伪多视频视频通过跨视图自我重新制定来学习4D头部合成器 ...

0 0 0 2025/06/03 arXiv:2403.13570v2 哦吼

Deep Learning with Differential Privacy

基于神经网络的机器学习技术正在在各种领域取得了显着的结果。通常，模型的培训需要大型代表性数据集，这些数据集可能会挤压并包含敏感信息。这些模型不应在这些数据集中公开私人信息 ...

0 0 0 2025/06/03 arXiv:1607.00133v2 hairushi

Efficient Time Series Processing for Transformers and State-Space Models through Token Merging

尽管次级注意机制或状态空间模型的最新进展，但处理长 Token 序列仍然施加了重大的计算要求。 Token 合并已成为提高计算机视觉体系结构计算效率的解决方案。在这项工作中，我们对在 Transformer 和州空间模型中的时间序列分析中合并的 Token 合并进行了首次研究 ...

0 0 0 2025/06/03 arXiv:2405.17951v2 smile

Systematic Categorization, Construction and Evaluation of New Attacks against Multi-modal Mobile GUI Agents

大型语言模型（LLM）和多模式大语言模型（MLLM）集成到移动GUI代理中的用户效率和经验显着提高。但是，这种进步还引入了尚未探索的潜在安全漏洞。在本文中，我们介绍了对多模式移动GUI代理商的系统安全调查，以解决现有文献中的这一关键差距 ...

0 0 0 2025/06/03 arXiv:2407.09295v3 hhhhh

LLM-Powered GUI Agents in Phone Automation: Surveying Progress and Prospects

随着大语言模型（LLM）的迅速增长，电话自动化发生了变化的变化。本文系统地回顾了LLM驱动的电话GUI代理，突出了它们从基于脚本的自动化到智能自适应系统的演变。我们首先将关键挑战的背景化，（i）有限的一般性，（ii）高维护开销和（iii）意图理解较弱，并通过先进的语言理解，多模式感知和强大的决策来展示LLM如何解决这些问题 ...

0 1 0 2025/06/03 arXiv:2504.19838v2 hhhhh

AutoLoss: Automated Loss Function Search in Recommendations

设计有效的损失功能在训练深度推荐系统中起着至关重要的作用。大多数现有作品通常都利用预定义和固定的损失功能，这可能会导致次优建议质量和培训效率。最近的一些努力依赖于详尽或手动搜索的权重来融合一组候选损失功能，这在计算和时间上的成本高昂 ...

0 0 0 2025/06/03 arXiv:2106.06713v1 sjdycht

Action is All You Need: Dual-Flow Generative Ranking Network for Recommendation

我们引入了一个双流生成排名网络（DFGR），以进行推荐方案。该体系结构仅利用原始的用户行为序列信息以及少量的基本信息，描述了依靠大量手动功能工程的深度学习建议模型（DLRMS）的局限性。 DFGR采用双流动机制来优化相互作用建模，确保通过端到端 Token 处理有效训练和推断 ...

0 0 0 2025/06/03 arXiv:2505.16752v2 buzz

Precise and Dexterous Robotic Manipulation via Human-in-the-Loop Reinforcement Learning

强化学习 (RL) 在实现复杂机器人操作技能的自主获取方面具有广阔的前景，但在现实环境中实现这种潜力一直具有挑战性。我们提出了一种基于人机循环视觉的 RL 系统，该系统在各种灵巧操作任务中表现出了令人印象深刻的性能，包括动态操作、精确组装和双臂协调。我们的方法集成了演示和人工修正、高效的 RL 算法和其他系统级设计选择，以学习能够实现近乎完美的成功率和仅 1 到 2 秒的快速周期时间的策略 ...

0 0 0 2025/06/03 arXiv:2410.21845v3 rommelcyzyb

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）