大语模型(LLMS)中的越狱漏洞是指通过精心制作提示或后缀从模型中提取恶意内容的方法,这引起了研究界的极大关注。但是,该模型很容易检测到主要关注语义水平的传统攻击方法。这些方法忽略了在不同输出阶段的模型对齐保护功能的差异 ...

0 0 0 0 2025/09/07 arXiv:2409.07503v1 chenzhuo-wang

在敏感领域中快速采用深度学习带来了巨大的好处。但是,这种广泛的采用也引起了严重的脆弱性,尤其是模型倒置(MI)攻击,对个人数据的隐私和完整性构成了重大威胁。这些攻击在生物识别技术,医疗保健和金融等应用中的越来越多的流行率迫切需要了解其机制,影响和防御方法 ...

0 0 0 0 2025/09/02 arXiv:2501.18934v2 chenzhuo-wang

尽管大型语言模型 (LLM) 因其卓越的功能而得到广泛应用,但已被证明容易受到后门攻击。这些攻击通过毒害训练样本和全参数微调,将有针对性的漏洞引入 LLM。然而,这种后门攻击是有限的,因为它们需要大量的计算资源,特别是随着 LLM 规模的增加 ...

0 0 0 0 2025/07/24 arXiv:2409.17946v4 chenzhuo-wang

主流后门对大语言模型(LLMS)的攻击通常在输入实例中设置固定的触发因素,并对触发查询的特定响应设置。但是,固定的触发设置(例如 ...

0 0 0 0 2025/07/23 arXiv:2404.14795v5 chenzhuo-wang

联合迅速学习已成为一种沟通效率和隐私性的范式,用于调整跨分散客户的大型视觉模型,例如剪辑。但是,此设置的安全性含义仍然没有被置于不足的状态。在这项工作中,我们介绍了联合及时学习中的后门攻击的首次研究 ...

0 0 0 0 2025/07/05 arXiv:2506.22506v1 chenzhuo-wang

使用行为生物识别技术的移动身份验证一直是研究的活跃领域。现有的研究依赖于构建机器学习分类器来识别个人的独特模式。但是,这些分类器不足以学习判别特征 ...

0 0 0 0 2025/06/30 arXiv:2005.12901v2 chenzhuo-wang

随着大型语言模型(LLM)的出现,医疗人工智能(AI)经历了实质性的技术进步和范式转移,强调了LLMS可以简化医疗保健服务并改善患者结果的潜力。考虑到这一快速技术进步,在这项调查中,我们追踪了医学大语言模型(MED-LLMS)的最新进展,包括背景,关键发现和主流技术,尤其是从通用模型到医学专业应用程序的发展。首先,我们深入研究Med-llms的基础技术,表明如何逐步适应复杂的医疗任务 ...

0 0 0 0 2025/06/24 arXiv:2406.03712v2 chenzhuo-wang

后门学习是研究深度神经网络脆弱性(DNNS)的新兴而重要的话题。在快速武器竞赛的状态下,正在提出许多开创性的后门攻击和防御方法。但是,我们发现,新方法的评估通常是验证其主张和准确绩效的不可思议的,这主要是由于快速发展,不同的环境以及实施和可重复性的困难 ...

0 0 0 0 2025/06/05 arXiv:2206.12654v2 chenzhuo-wang

多模式的大语言模型(MLLM)越来越多地部署在微调AS-AS-AS-AS-Service(FTAAS)设置中,其中用户提交的数据集将通用通用模型适应下游任务。但是,这种灵活性引入了严重的安全风险,因为恶意微调可以以最小的努力将后门植入MLLM。在本文中,我们观察到后门通过引起异常注意力集中在非语义区域的异常注意力来系统地破坏跨模式处理 - 这种现象我们称注意力崩溃 ...

0 0 0 0 2025/05/29 arXiv:2505.16916v1 chenzhuo-wang

联合持续学习(FCL)允许每个客户从任务流不断更新其知识,从而增强了在现实世界中联合学习的适用性。但是,FCL不仅需要解决客户之间的空间数据异质性,还需要解决任务之间的时间数据异质性。在本文中,经验实验表明,这种输入水平的异质性显着影响模型的内部参数和输出,从而导致严重的时空灾难性遗忘局部和先前的知识 ...

0 0 0 0 2025/05/25 arXiv:2412.18355v2 chenzhuo-wang