大型语言模型(LLMS)的流利度和广泛使用量强调了相应工具的可取性,以帮助LLM生成的文本检测。在本文中,我们确定了LLM概率函数结构的属性,可用于该检测。具体而言,我们证明了从LLM采样的文本倾向于占据模型对数概率函数的负曲率区域 ...

0 0 0 0 2025/07/16 arXiv:2301.11305v2 15966829631

将AI生成的代码与人写的代码区分开来对诸如作者归因,内容跟踪和滥用检测等任务变得至关重要。基于此,基于N克的水印方案已成为突出的水印方案,它注入了一代期间要检测到的秘密水印。但是,它们在代码内容中的鲁棒性仍然不足以评估 ...

0 0 0 0 2025/07/16 arXiv:2507.05512v1 15966829631

尽管有自主性代理推理的承诺,但由于不受限制的LLM驱动的结构,现有的工作流生成方法经常产生脆弱的,不可阻止的计划。我们介绍了Mermaidflow,这是一个框架,该框架通过安全限制的图表演变重新定义了代理搜索空间。 Mermaidflow以Mermaid使用Mermaid(一种结构化且人性化的图形语言)表示工作流程作为可验证的中间表示 ...

0 0 0 0 2025/07/16 arXiv:2505.22967v1 15966829631

检测AI生成的代码,深击和其他合成内容是一项新兴的研究挑战。随着大语言模型(LLM)生成的代码变得越来越普遍,确定每个样本背后的特定模型越来越重要。本文介绍了C计划的LLM作者身份归因的首次系统研究 ...

0 0 0 0 2025/07/14 arXiv:2506.17323v1 15966829631

大型语言模型(LLM)的能力越来越多,引起了人们对AI生成的窃和社会工程学的滥用的担忧。尽管已经提出了各种AI生成的文本检测器来减轻这些风险,但许多探测器仍然容易受到简单的逃避技术的影响,例如释义。但是,最近的探测器对这种基本攻击表现出更大的鲁棒性 ...

0 0 0 0 2025/07/11 arXiv:2506.07001v1 15966829631

大型语言模型的恶意使用的增加,例如虚假的内容创建和学术窃,激发了识别AI生成的文本的方法的发展,包括基于水印或离群值检测的方法。但是,这些检测算法对AI生成的文本的释义的鲁棒性尚不清楚。为了测试这些探测器,我们构建了一个11B参数解释模型(Dipper),该模型可以解释段落,周围环境的条件以及控制词汇多样性和内容重新排序 ...

0 0 0 0 2025/07/11 arXiv:2303.13408v2 15966829631

可扩展矢量图形 (SVG) 因其分辨率的无限可扩展性、多功能可用性和编辑功能而成为现代图像渲染应用程序中不可或缺的一部分。 SVG 在网页开发和图形设计领域特别受欢迎。使用深度学习进行 SVG 建模的现有方法通常难以生成复杂的 SVG,并且仅限于需要大量处理和简化的简单模型 ...

0 0 0 0 2025/07/10 arXiv:2312.11556v4 15966829631

尽管事实证明,预先训练的语言模型对学习高质量的语义表示有用,但这些模型仍然容易受到简单的扰动的影响。最近的作品旨在提高预训练模型的鲁棒性,主要集中于具有类似语义的扰动示例的对抗训练,从而忽略了对不同语义甚至相反语义的利用。与图像处理字段不同,文本是离散的,很少有单词替换会导致大量的语义变化 ...

0 0 0 0 2025/07/08 arXiv:2107.00440v1 15966829631

大型语言模型(LLMS)通常在可视化任务中遇到的努力,例如绘制图,图表,成功取决于代码正确性和视觉语义。现有的指令调查数据集缺乏执行的监督,并为迭代代码校正提供了有限的支持,从而导致脆弱且不可靠的情节生成。我们提出了Viscode-200k,这是一种用于基于Python的可视化和自我纠正的大规模指令调整数据集 ...

0 0 0 0 2025/07/08 arXiv:2506.03930v1 15966829631

检测现代大型语言模型生成的文本被认为很困难,因为 LLM 和人类都可以表现出各种复杂的行为。然而,我们发现基于对比两种密切相关的语言模型的分数在区分人类生成的文本和机器生成的文本方面非常准确。基于这种机制,我们提出了一种新颖的 LLM 检测器,只需要使用一对预先训练的 LLM 进行简单的计算 ...

0 0 0 0 2025/07/02 arXiv:2401.12070v3 15966829631

来一起翻译吧!


为了您和其他读者获得更好的阅读体验,请您在阅读时勇敢地改正翻译,特别是一些显而易见的机器翻译错误。


虽然我们追求卓越,但我们并不要求翻译十全十美,因此请不要担心您翻译有误 —— 我们的服务器已经记录所有的翻译,您不必担心会因为您的失误导致无法挽回的破坏。(改编自维基百科)