一译 —— 文档和论文翻译、对照阅读、讨论和社区

TeLU Activation Function for Fast and Stable Deep Learning

我们提出了双曲线切线指数线性单元（TELU），这是一种神经网络隐藏的激活函数，定义为Telu（x）= XTANH（EXP（x））。 Telu的设计基于关键激活函数的核心原理，通过紧密近似于其活性区域的身份函数，同时有效地减轻其饱和区域中消失的梯度问题，从而实现了强收敛。它的简单公式提高了计算效率，从而提高了可伸缩性和收敛速度 ...

0 0 0 2025/07/01 arXiv:2412.20269v2 xubiao

A Survey of Event Causality Identification: Taxonomy, Challenges, Assessment, and Prospects

事件因果关系识别（ECI）已成为自然语言处理（NLP）的关键任务，旨在自动检测文本中事件之间的因果关系。在这项综合调查中，我们系统地阐明了ECI的基本原理和技术框架，提出了一个新颖的分类框架来对现有方法进行分类和阐明。 {我们讨论相关的挑战，提供定量评估，并概述这个动态和快速发展的领域的未来方向 ...

0 0 0 2025/07/01 arXiv:2411.10371v3 xuexizhanghao

Dex1B: Learning with 1B Demonstrations for Dexterous Manipulation

为灵巧的手动操纵生成大规模的示范仍然具有挑战性，并且近年来提出了几种方法来解决这一问题。其中，生成模型已成为有希望的范式，从而有效地创造了多样化和物理上合理的示范。在本文中，我们介绍了Dex1b，这是一种由生成模型生产的大规模，多样化和高质量的演示数据集 ...

0 0 0 2025/07/01 arXiv:2506.17198v1 13718039169

Learning Image-adaptive 3D Lookup Tables for High Performance Photo Enhancement in Real-time

近年来，基于学习的方法越来越受欢迎，以增强照片的颜色和色调。但是，许多现有的照片增强方法要么带来不令人满意的结果，要么消耗过多的计算和内存资源，从而阻碍其应用于实际上在高分辨率图像（通常超过12百万像素）上。在本文中，我们学习图像自适应的3维查找表（3D LUTS），以实现快速稳固的照片增强功能 ...

0 0 0 2025/07/01 arXiv:2009.14468v1 howieeyang

FIRST: Teach A Reliable Large Language Model Through Efficient Trustworthy Distillation

大型语言模型（LLMS）在我们的日常生活中变得越来越普遍，导致人们期望LLM值得信赖 - 精确且精心校准（预测信心应与其基础真理正确性的可能性保持一致）。如今，微调已成为通过显着提高下游任务的准确性来调整模型来实用使用的最流行方法。尽管取得了很高的准确性，但我们发现，由于“调谐引起的错误校准”，微调仍然与令人满意的可信赖性相距甚远 ...

0 0 0 2025/07/01 arXiv:2408.12168v2 ka

VLN-R1: Vision-Language Navigation via Reinforcement Fine-Tuning

Vision语言导航（VLN）是体现AI的核心挑战，要求代理使用自然语言指令导航现实世界环境。当前基于语言模型的导航系统在离散拓扑图上运行，将路径计划限制为预定义的节点连接。我们提出了VLN-R1，这是一个端到端的框架，利用大型视觉模型（LVLM）将以自我为中心的视频流直接转化为连续导航动作，采用基于GRPO的培训，灵感来自DeepSeek-R1 ...

0 0 0 2025/07/01 arXiv:2506.17221v2 jesson

Neural Dueling Bandits: Preference-Based Optimization with Human Feedback

上下文对决匪徒用于建模匪徒问题，其中学习者的目标是使用观察到的嘈杂的人类偏好反馈在过去的上下文中找到给定上下文的最佳手臂。但是，现有算法假定奖励函数是线性的，在许多现实生活应用程序（例如在线建议或对Web搜索结果排名）中，它可能是复杂且非线性的。为了克服这一挑战，我们使用神经网络使用先前选择的武器的偏好反馈来估算奖励功能 ...

0 0 0 2025/07/01 arXiv:2407.17112v2 syhhh

Robust Contrastive Learning Using Negative Samples with Diminished Semantics

由于发展了更有效的对比学习方法，因此无监督的学习最近取得了出色的进步。但是，CNN容易依赖于人类认为非语义的低级特征。这种依赖性已被猜想引起对图像扰动或域移位缺乏鲁棒性 ...

0 0 0 2025/07/01 arXiv:2110.14189v2 15966829631

来一起翻译吧！

为了您和其他读者获得更好的阅读体验，请您勇敢地改进翻译，特别是一些显而易见的机器翻译错误。

虽然我们追求卓越，但我们并不要求翻译十全十美，因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译，您不必担心会因为您的失误导致无法挽回的破坏。（改编自维基百科）