胶囊是一组神经元,其活动向量表示特定类型实体(例如对象或对象部分)的实例化参数。我们使用活动向量的长度来表示实体存在的概率,并使用其方向来表示实例化参数。某一级别的活动胶囊通过变换矩阵对更高级别胶囊的实例化参数进行预测 ...

0 0 0 0 2024/04/07 arXiv:1710.09829v2 xx

训练最先进的深度神经网络的计算成本很高。减少训练时间的一种方法是使神经元的活动正常化。最近引入的一种称为批量归一化的技术,使用小批量训练案例中神经元的输入总和的分布来计算均值和方差,然后使用它们对每个训练案例上该神经元的输入总和进行归一化... ...

0 0 0 0 2025/05/02 arXiv:1607.06450v1 xx

本文介绍了 SimCLR:一个用于视觉表示对比学习的简单框架。我们简化了最近提出的对比自监督学习算法,而不需要专门的架构或存储库。为了了解是什么使对比预测任务能够学习有用的表示,我们系统地研究了我们框架的主要组成部分... ...

0 0 0 0 2024/12/07 arXiv:2002.05709v3 xx

当大型前馈神经网络在小型训练集上进行训练时,它通常在保留的测试数据上表现不佳。通过在每个训练案例中随机省略一半的特征检测器,可以大大减少这种“过度拟合”。这可以防止复杂的协同适应,其中特征检测器仅在几个其他特定特征检测器的上下文中才有帮助 ...

0 0 0 0 2024/04/07 arXiv:1207.0580v1 xx

在过去的几年中,图神经网络(GNN)已成为分析图数据和学习图数据的标准工具包。这个新兴领域见证了有前景的技术的广泛发展,这些技术已成功评估计算机科学、数学、生物学、物理和化学。但任何成功的领域要成为主流可靠,就必须制定基准来量化进展... ...

0 0 0 0 2024/10/09 arXiv:2003.00982v5 xx

生成流网络 (GFlowNets) 已被引入作为一种在主动学习环境中对不同候选集进行采样的方法,其训练目标是使它们大致按给定奖励函数的比例进行采样。在本文中,我们展示了 GFlowNet 的许多附加理论特性。它们可用于估计联合概率分布和相应的边际分布,其中某些变量未指定,并且特别有趣的是,它们可以表示复合对象(如集合和图)上的分布 ...

0 0 0 0 2024/04/07 arXiv:2111.09266v4 xx

当前构建通用人工智能系统的方法往往会产生具有有益和有害功能的系统。人工智能开发的进一步进展可能会带来极大风险的能力,例如进攻性网络能力或强大的操纵技能。我们解释了为什么模型评估对于解决极端风险至关重要 ...

0 0 0 0 2024/04/07 arXiv:2305.15324v2 xx

在这篇简短的共识文件中,我们概述了即将到来的先进人工智能系统的风险。我们研究大规模的社会危害和恶意使用,以及人类对自主人工智能系统不可逆转的控制丧失。鉴于人工智能的快速和持续进步,我们提出了人工智能研发和治理的紧迫优先事项 ...

0 0 0 0 2024/04/07 arXiv:2310.17688v2 xx

用于条件数据生成的机器学习方法通​​​​常构建从源条件数据 X 到目标数据 Y 的映射。目标 Y(例如 ... ...

0 0 0 0 2024/12/26 arXiv:2301.08846v1 xx

我们提出了图注意力网络(GAT),这是一种对图结构数据进行操作的新型神经网络架构,利用亮度自注意力层来解决基于图的近似近似现有方法的视觉。节点节点能够参与其邻域特征的层,我们可以(隐)为邻域中的不同节点指定不同的权重,而不需要任何类型的昂贵的矩阵损害(例如求式逆)或依赖对图的了解预先结构。通过这种方式,我们同时解决了基于谱图神经网络的几个关键挑战,巩固了我们的模型易于适用于归纳和当前问题...... ...

0 1 0 0 2024/11/01 arXiv:1710.10903v3 xx

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)