分别分布(OOD)检测是机器学习模型的安全部署的一个关键问题,该模型识别出介于培训分布之外的样本,即分布数据(ID) ...

0 0 0 0 2025/06/16 arXiv:2310.01942v1 15966829631

分布(OOD)概括对于现实世界中部署的机器学习模型至关重要。但是,实现这一目标在根本上可能具有挑战性,因为它需要能够在不同领域或环境中学习不变特征的能力。在本文中,我们提出了一个新型的框架hypo(helferspherical ood概括),该框架可以在超级球形空间中学习域不变的表示 ...

0 0 0 0 2025/06/16 arXiv:2402.07785v3 15966829631

域的适应(DA)受益于严格的理论著作,该著作研究了其有见地的特征和各个方面,例如学习领域不变的表示及其权衡 ...

0 0 0 0 2025/06/16 arXiv:2111.13822v1 15966829631

大型语言模型(LLM)在产生多种文本内容方面已经达到了类似人类的熟练程度,强调了有效的假文本检测的必要性,以避免在社交媒体上的假新闻等潜在风险。先前的研究主要测试了分布数据集上的单个模型,从而限制了我们对这些模型在不同类型的数据中如何执行LLM生成的文本检测任务的理解。我们通过在分布和分布数据集上测试五个基于 Transformer 的专业模型来研究此问题,以更好地评估其性能和概括性 ...

0 0 0 0 2025/06/15 arXiv:2403.13335v1 15966829631

在过去的几年中,深度学习取得了巨大的成功。但是,面对非IID情况,深度学习的表现可能会阻碍。域的概括(DG)使模型可以概括为看不见的测试分布,即 ...

0 0 0 0 2025/06/15 arXiv:2207.12020v2 15966829631

迅速学习是通过使用很少的样本调整可学习的及时向量来调整强大的视觉语言基础模型(例如剪辑)的最有效和热门方式之一。但是,尽管及时的学习在内域数据上取得了出色的表现,但它仍然面临着概括不见的类和领域的主要挑战。一些现有的及时学习方法通​​过适应为不同的 Token 或域的不同提示来解决这个问题,但忽略了学到的提示能力概括到看不见的域 ...

0 0 0 0 2025/06/15 arXiv:2212.04196v2 15966829631

自动睡眠分期对于睡眠评估和疾病诊断至关重要。大多数现有方法取决于一个特定的数据集,并且仅限于将培训数据和测试数据来自同一数据集的其他看不见的数据集。在本文中,我们将域的概括引入自动睡眠阶段,并提出了可推广睡眠阶段的任务,该任务旨在提高模型的概括能力,使其无法看到数据集 ...

0 0 0 0 2025/06/15 arXiv:2401.05363v5 15966829631

基于实例歧视任务的自我监督学习(SSL)方法取得了巨大的成功。尽管他们成功了,但SSL模型通常很难为看不见的域数据生成有效的表示。为了解决这个问题,已经进行了无监督的域概括(UDG)的研究,该研究旨在开发可以生成域 - iRrelevant特征的SSL模型 ...

0 0 0 0 2025/06/15 arXiv:2412.09074v1 15966829631

跨域情感分析旨在使用在源域上训练的模型来预测目标域中文本的情绪,以应对标记数据的稀缺性。先前的研究主要是针对任务的基于跨透明的方法,这些方法受到不稳定性和泛化不良的方式。在本文中,我们探讨了有关跨域情感分析任务的对比度学习 ...

0 0 0 0 2025/06/15 arXiv:2208.08678v1 15966829631

自然语言处理(NLP)中的机器学习(ML)系统在推广到分布(OOD)数据方面面临着重大挑战,其中测试分布与培训数据分布不同。这提出了有关NLP模型鲁棒性及其高精度的重要问题,由于它们对系统偏见的敏感性,可能会人为地膨胀。尽管存在这些挑战,但从文本分类中的OOD角度来看,对概括挑战缺乏全面的调查 ...

0 0 0 0 2025/06/15 arXiv:2305.14104v1 15966829631