15966829631的文档

InfoCSE: Information-aggregated Contrastive Learning of Sentence Embeddings

对比度学习已在嵌入学习的句子中进行了广泛的研究，该句子假设同一句子的不同观点的嵌入更接近。这个假设带来的约束很薄弱，良好的句子表示也应该能够重建原始句子片段。因此，本文提出了一个被称为Infocse的无监督句子嵌入的信息聚集的对比学习框架 ...

0 0 0 0 2025/07/01 arXiv:2210.06432v3 15966829631

Balanced Contrastive Learning for Long-Tailed Visual Recognition

现实世界中的数据通常遵循长尾巴的分布，其中一些多数类别占据了大多数数据，而大多数少数族裔类别都包含有限数量的样本。分类模型最小化的跨凝结努力来代表和对尾部类别进行分类。尽管对学习公正的分类器的学习问题进行了充分的研究，但代表数据不平衡数据的方法却没有探索 ...

0 0 0 0 2025/07/01 arXiv:2207.09052v3 15966829631

Hyperbolic Contrastive Learning for Visual Representations beyond Objects

尽管自我监督的方法已导致视觉表示学习的快速进步，但这些方法通常使用相同的镜头处理对象和场景。在本文中，我们专注于对物体和场景的学习表示，这些对象和场景保留了它们之间的结构。通过观察到在表示空间中接近视觉上相似的对象的动机，我们认为场景和对象应该基于其组成性遵循层次结构 ...

0 0 0 0 2025/06/30 arXiv:2212.00653v1 15966829631

Towards a Theoretical Framework of Out-of-Distribution Generalization

对分布（OOD）数据的概括是现代机器学习中的核心问题之一。最近，提出算法的尝试激增，主要基于提取不变特征的想法。尽管在直觉上合理，但对哪种不变性可以保证的理论理解仍然有限，并且对任意分布的概括显然是不可能的 ...

0 0 0 0 2025/06/30 arXiv:2106.04496v3 15966829631

Towards the Generalization of Contrastive Self-Supervised Learning

最近，自我监督的学习吸引了极大的关注，因为它仅需要用于模型培训的未标记数据。对比学习是一种自我监督学习的一种流行方法，并实现了有希望的经验表现。但是，对其概括能力的理论理解仍然有限 ...

0 0 0 0 2025/06/30 arXiv:2111.00743v4 15966829631

AutoDroid-V2: Boosting SLM-based GUI Agents via Code Generation

大型语言模型（LLM）为移动UI代理带来了令人兴奋的新进步，这是一个长期存在的研究领域，旨在通过移动UI交互完成任意自然语言任务。但是，现有的UI代理通常需要强大的大型语言模型，这些模型很难在最终用户的设备上部署，这引起了人们对用户隐私和集中服务成本的极大关注。受近期小语言模型（SLM）的非凡编码能力的启发，我们建议将UI任务自动化问题转换为代码生成问题，该问题可以由Ondevice SLM有效地解决，并使用evevice代码解释器有效地执行 ...

0 0 0 0 2025/06/26 arXiv:2412.18116v3 15966829631

SoK: How Robust is Audio Watermarking in Generative AI models?

音频水印越来越多地用于验证AI生成的内容的出处，从而实现了诸如检测AI生成的语音，保护音乐IP和防御语音克隆之类的应用程序。为了有效，音频水印必须抵制扭曲信号以逃避检测的删除攻击。尽管许多方案声称鲁棒性，但这些主张通常是孤立的，并反对有限的攻击 ...

0 0 0 0 2025/06/26 arXiv:2503.19176v2 15966829631

AI-Generated Music Detection and its Challenges

面对生成模型的新时代，人工产生的内容的检测已成为最重要的问题。特别是，在用户友好型平台上创建可靠的长时间合成音乐的能力在流媒体服务和对人类艺术家的不公平竞争中构成了真正的欺诈威胁。本文展示了包含真实音频和人工重建的数据集上培训分类器的可能性（令人惊讶的），具有令人信服的精度为99 ...

0 0 0 0 2025/06/26 arXiv:2501.10111v1 15966829631

Between Lines of Code: Unraveling the Distinct Patterns of Machine and Human Programmers

大型语言模型已经催化了代码生成中前所未有的波浪。在取得重大进步的同时，它们模糊了机器和人为源代码之间的区别，从而导致软件工件的完整性和真实性问题。事实证明，诸如检测之类的方法（例如检测）可以有效辨别机器生成的文本，但它们没有识别和利用机器生成的代码的独特模式 ...

0 0 0 0 2025/06/20 arXiv:2401.06461v5 15966829631

SphOR: A Representation Learning Perspective on Open-set Recognition for Identifying Unknown Classes in Deep Learning Models

深度学习分类器的广泛使用需要开放式识别（OSR），这不仅可以从培训期间已知的类，而且还可以从测试数据中可能存在的未知类别中识别输入数据。由于依赖复杂的生成模型或高训练成本，许多现有的OSR方法在计算上昂贵。我们从表示学习的角度研究OSR，特别是通过球形嵌入 ...

0 0 0 0 2025/06/16 arXiv:2503.08049v2 15966829631