我们将拓扑数据分析方法应用于损失功能,以了解深入的神经网络和深度神经网络的概括属性。我们使用损失函数的摩尔斯复合物将梯度下降轨迹的局部行为与损耗表面的全局性质联系起来。我们定义了神经网络拓扑障碍的评分“ to-Score”,借助稳健的拓扑不变式,损失函数的条形码,从而量化了基于梯度的优化的局部最小值的“不良度” ...
0 0 0 2025/05/22 arXiv:2012.15834v2 UUU
神经网络的定位行为是网络组件的一部分或组件之间的相互作用子集,是分析网络机制和可能的故障模式的自然第一步。现有的工作通常是定性的,并且对评估本地化索赔的适当方式尚无共识。我们介绍了路径修补程序,这是一种表达和定量测试自然类别的假设的技术,表达行为位于一组路径上 ...
0 0 0 2025/05/22 arXiv:2304.05969v2 UUU
大型培训数据集驱动了语音生成的最新进展。但是,由于依靠有限的有声读物数据集,当前模型没有捕获现实世界中言语中固有的自发性和可变性。为了弥合这一差距,我们介绍了Emilia-Pipe,这是一种开源预处理管道,旨在从宝贵但毫无疑问的内部数据中提取高质量的培训数据,这些数据在现实世界中捕获自发的人类语音 ...
0 0 0 2025/05/22 arXiv:2501.15907v1 小肥柴
与不透明对象相比,现代跟踪器的性能在透明物体上大大降低。这主要是由于两个不同的原因。透明对象是独一无二的,因为它们的外观直接受背景影响 ...
0 0 0 2025/05/21 arXiv:2401.03872v1 xiong11
大型语言模型(LLM)代理通常采用逐步推理框架,在该框架中,他们交织了思考和行动以完成给定任务的过程。但是,该范式面临着根深蒂固的一通问题,每个产生的中间思想都会插入轨迹中,无论其正确性如何,这可能会导致不可逆的错误传播。为了解决这个问题,本文提出了一个新颖的框架,称为“发电机辅助逐步回滚”(GA-ROLLBACK),以诱导LLM代理的更好决策 ...
0 0 0 2025/05/21 arXiv:2503.02519v2 RAINY
在计算机视觉和图形中,代表和渲染2D图像的动态场景是一个基本而又具有挑战性的问题。这项调查对动态场景表示和渲染的演变和进步进行了全面的综述,并特别强调了基于神经辐射场和基于3D高斯分裂的重建方法的最新进展。我们系统地总结了现有方法,根据其核心原则对它们进行分类,编译相关数据集,比较这些基准测试的各种方法的性能,并探索这个迅速发展的领域中的挑战和未来研究方向 ...
0 0 0 2025/05/21 arXiv:2503.08166v1 Roa
在本文中,我们学习了一个扩散模型,以生成场景尺度上的3D数据。具体而言,我们的模型制作了一个由多个对象组成的3D场景,而最近的扩散研究集中在一个对象上。为了实现我们的目标,我们代表带有离散类标签的场景,即 ...
0 0 0 2025/05/21 arXiv:2301.00527v1 leonupup
近年来,学到的图像压缩(LIC)已成为图像存储和传输的有效解决方案。但是,由于捕获各向异性频率组件和保留方向细节的限制,现有的LIC方法在潜在表示中是多余的。为了克服这些挑战,我们提出了一种新颖的频率吸引 Transformer (FAT)阻止,该阻滞首次实现LIC的多尺度定向ananlysis ...
0 0 0 2025/05/21 arXiv:2310.16387v4 allen1000

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您勇敢地改进翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)