现实世界中的视觉数据通常显示出长尾巴的分布,其中一些“头”类有大量样本,但只有几个样本可用于“尾巴”类。这种不平衡的分布在学习深度神经网络方面造成了巨大的挑战,可以将其归结为困境:一方面,我们更喜欢增加尾部类样品的暴露,以避免在分类器培训中校准过度优势。另一方面,过度采样的尾巴课程使网络容易拟合,因为因此总体级别的样本通常不足以代表 ...

0 0 0 0 2025/06/30 arXiv:1912.04486v2 yqstar

深度学习方法已经显着提出了各种数据驱动的任务,例如回归,分类和预测。但是,这种进步的大部分是基于强烈但通常不切实际的假设,即训练数据集相对于它们所包含的目标是平衡的。这种与现实情况的未对准,在现实世界中,数据经常失衡,这阻碍了此类模型在实际应用中的有效性 ...

0 0 0 0 2025/06/29 arXiv:2310.07598v1 yqstar

现实世界中的数据通常显示出不平衡的分布,其中某些目标值的观察值大大较少。现有用于处理不平衡数据的技术集中在具有分类指数的目标上,即 ...

0 0 0 0 2025/06/29 arXiv:2102.09554v2 yqstar

记忆在机器学习(ML)中的作用引起了极大的关注,尤其是在经验观察到现代模型以记住训练数据的片段时。以前的理论分析,例如费尔德曼的开创性工作,将记忆归因于训练数据中长尾分布的普遍性,这证明了在分布尾部的样本中不可避免的。但是,记忆和值得信赖的ML研究的交集揭示了关键的差距 ...

0 0 0 0 2025/06/29 arXiv:2503.07501v1 yqstar

长尾数据是一种特殊的多类失衡数据,具有大量的少数族裔/尾巴,具有非常明显的综合影响。长尾学习旨在在具有长尾分布的数据集上建立高性能模型,这些模型可以以高准确性识别所有类,尤其是少数族裔/尾巴类。这是一个尖端的研究方向,在过去几年中吸引了大量的研究工作 ...

0 1 0 0 2025/06/29 arXiv:2408.00483v1 yqstar

视觉世界的长尾分布对基于深度学习的分类模型构成了巨大的挑战。现有的解决方案通常涉及集体平衡策略,例如 ...

0 1 0 0 2025/06/27 arXiv:1910.09217v2 yqstar

负面采样已被大量用于在大规模数据上训练推荐模型,其中采样示例通常不仅可以加速收敛性,而且可以提高模型的准确性。然而,尚未透露硬性阴性采样(HNS)有效性的原因。在这项工作中,我们通过对HNS进行彻底的理论分析来填补研究空白​​ ...

0 1 0 0 2025/06/27 arXiv:2302.03472v2 yqstar

准确预测观看时长对于优化短视频平台的推荐和用户体验至关重要。然而,估计单个平均观看时间的现有方法通常无法捕捉用户参与模式中固有的不确定性和多样性。在本文中,我们提出了条件分位数估计(CQE)框架来对观看时间的整个条件分布进行建模 ...

0 0 0 0 2025/06/07 arXiv:2407.12223v5 yqstar

排名模型主要集中于对预测的相对顺序进行建模,同时经常忽略其绝对值准确性的重要性。但是,准确的绝对值对于某些下游任务至关重要,因此需要对原始预测进行校准。为了解决这个问题,现有的校准方法通常采用具有订单保留属性的预定义转换功能来调整原始预测 ...

0 0 0 0 2025/06/03 arXiv:2504.14243v1 yqstar

近年来,已经对无监督的域适应性(UDA)算法进行了积极研究,但大多数算法和理论结果都集中在单源无耐心的域适应(SUDA)上 ...

0 0 0 0 2025/04/14 arXiv:2201.01003v1 yqstar

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)