我们介绍了Ghostbuster,这是一种用于检测AI生成文本的最先进系统。我们的方法通过通过一系列较弱的语言模型传递文档,对其功能的可能组合进行结构化搜索,然后在所选功能上训练分类器,以预测文档是否是AI生成的。至关重要的是,Ghostbuster不需要从目标模型中访问 Token 概率,这对于检测由黑盒模型或未知模型版本生成的文本有用 ...
本文介绍了AIDETX,这是一种使用数据压缩技术检测机器生成的文本的新方法。传统方法(例如深度学习分类器)通常会遭受高计算成本和有限的解释性损失。为了解决这些限制,我们提出了一个基于压缩的分类框架,该框架利用有限的文本模型(FCMS) ...
随着开放式文本生成的重大进展,衡量机器生成的文本与人类语言的距离仍然是一个关键的开放问题。我们介绍了淡紫色,这是开放式文本生成的比较度量,该措施将从文本生成模型与使用Divergence Frontiers的人撰写文本的分布进行了比较。淡紫色通过计算量化嵌入空间中的信息差异来扩展到现代文本生成模型 ...
大型语言模型(LLM)产生的文本非常接近高质量的人类创造的文本,这引起了人们对它们在传播虚假信息和学术不当行为时潜在滥用的担忧。因此,迫切需要一个高度实用的检测工具,能够准确识别给定文本的来源。但是,现有的检测工具通常依赖于对LLM的访问,并且只能区分机器生成和人为作者的文本,无法满足细粒度追踪,中间判断和快速检测的要求 ...
先进的大型语言模型(LLMS)可以生成文本几乎与人写的文本几乎没有区别,从而强调了LLM生成的文本检测的重要性。但是,当前的零击技术面临挑战,因为白盒方法仅限于使用较弱的开源LLM,而黑盒方法受到更强的专有LLM的部分观察的限制。似乎不可能启用白色框方法使用专有模型,因为对模型的API级访问均未提供完整的预测分布或内部嵌入 ...
已经表明,在某些情况下,有效地区分人类和机器生成的文本的填充 Transformer 和其他监督探测器:2305.13242,但我们发现,即使是N-gram和部分语音特征的简单分类器也可以在内部和远距离数据上实现非常强大的性能。为了了解这是如何实现的,我们分析了五个数据集中的机器生成的输出文本,发现LLM具有独特的指纹,这些指纹在某些词汇和形态句法特征的频率上显然是略有差异 ...
如今,强大的大型语言模型(LLM)(例如Chatgpt)已经在各种任务中展示了革命性的力量。因此,随着LLMS变得更加先进和普遍,机器生成的文本(MGT)的检测变得越来越重要。这些模型具有生成类似人类的语言的能力,使识别文本是由人类还是机器撰写的具有挑战性 ...
语言模型的快速改善增加了滥用文本生成系统的幽灵。这一进步促使开发简单的方法用于检测可以使用并解释为非专家的生成文本。我们开发了GLTR,这是一种支持人类检测文本是否由模型生成的工具 ...
大型语言模型(LLMS)已在各个应用程序领域中广泛使用,但是它们的黑盒性质在理解这些模型如何在内部处理以做出预测方面面临着重大挑战。在本文中,我们介绍了一项精确和定量的法律,该法律通过预先训练的LLM中的中间层来控制上下文化 Token 嵌入的学习,以进行下一个预测。我们的发现表明,从最低层到最高层,每层层都同样有助于增强预测准确性 - 在各种各样的开源LLM中观察到的普遍现象,建立在诸如 Transformer ,RWKV和Mamba之类的体系结构上 ...
近年来,已经出现了众多开源基础模型,在一些广泛参加的领域取得了显着的进步,其性能非常接近封闭源模型。但是,在高价值但更具挑战性的科学专业领域中,这些领域仍然依赖专家模型,或者与流行地区的一般基础模型的进步显着落后,远远不足以改变科学研究并在这些科学领域中的开源模型和封闭的模型之间存在很大的差距。为了减轻这一差距并探索迈向人工通用情报(AGI)的一步,我们介绍了Intern-S1,这是一位专门的通用专家,配备了一般理解和推理能力,并具有专业知识,可以分析多个科学模态数据 ...