大型语言模型 (LLM) 因其在理解和生成类人文本方面的卓越能力而彻底改变了人工智能 (AI) 服务。尤其是 LLM 聊天机器人已得到广泛采用,改变了人机交互。然而,这些 LLM 聊天机器人很容易受到“越狱”攻击,即恶意用户操纵提示来引发不适当或敏感的响应,从而违反服务策略 ...
大型语言模型 (LLM) 很容易受到越狱攻击,从而导致有害、不道德或有偏见的文本生成。然而,现有的越狱方法的计算成本很高。在本文中,我们提出了从弱到强的越狱攻击,这是一种攻击对齐的 LLM 以产生有害文本的有效方法 ...
半监督学习已被证明是利用未标记数据来减轻对大型标记数据集的依赖的强大范例。在这项工作中,我们统一了当前半监督学习的主流方法,以产生一种新算法 MixMatch,该算法通过猜测数据增强的未标记示例的低熵标签并使用 MixUp 混合标记和未标记数据来工作。我们表明,MixMatch 在许多数据集和标记数据量中大幅获得了最先进的结果 ...
在教育应用中,知识追踪是指根据学生过去对问题的回答来估计学生随时间变化的概念/技能掌握水平并预测他们未来的表现的问题。大多数现有知识追踪方法的一个关键限制是它们将学生对问题的回答视为二元值,即 ...
以参数有效的方式微调预训练的大型语言模型因其有效性和效率而被广泛研究。流行的低秩适应方法(LoRA)提供了一种值得注意的方法,假设适应过程本质上是低维的。尽管 LoRA 表现出了值得称赞的性能,但它是通过固定且不可更改的内在等级来实现的,这可能并不总是理想的选择 ...
预测周围车辆的运动对于在复杂交通中部署的自动驾驶车辆来说是一项关键能力。场景中所有车辆的运动受交通环境控制,即 ...
图级异常检测 (GLAD) 旨在识别与集合中的大多数图相比表现出显着差异的图。然而,当前的工作主要集中于评估图级异常,而未能为预测提供有意义的解释,这在很大程度上限制了其可靠性和应用范围。在本文中,我们研究了一个新的具有挑战性的问题,可解释的 GLAD,其中学习目标是预测每个图样本的异常情况以及相应的解释,即 ...
视觉文本渲染对当代文本到图像生成模型提出了根本性挑战,其核心问题在于文本编码器的缺陷。为了实现准确的文本渲染,我们确定了文本编码器的两个关键要求:字符识别和字形对齐。我们的解决方案涉及通过使用精心策划的配对字形文本数据集微调字符感知 ByT5 编码器来制作一系列定制文本编码器 Glyph-ByT5 ...