chenzhuo-wang的文档

Unveiling Backdoor Risks Brought by Foundation Models in Heterogeneous Federated Learning

基础模型（FMS）已用于生成合成公共数据集，以解决每个客户使用唯一的模型体系结构的异质联合学习（HFL）问题。但是，在HFL上下文中并未对整合FMS的漏洞，尤其是针对后门攻击的漏洞。在本文中，我们引入了一种新型的HFL后门攻击机制，该机制规避了对客户妥协或持续参与FL过程的需求 ...

0 0 0 0 2025/03/19 arXiv:2311.18350v1 chenzhuo-wang

Privacy in Fine-tuning Large Language Models: Attacks, Defenses, and Future Directions

微调已成为利用大型语言模型（LLM）进行特定下游任务的关键过程，使这些模型能够在各个领域实现最新的性能。但是，微调过程通常涉及敏感数据集，引入了利用此阶段独特特征的隐私风险。在本文中，我们对与微调LLM相关的隐私挑战进行了全面的调查，强调了各种隐私攻击的脆弱性，包括会员推理，数据提取和后门攻击 ...

0 0 0 0 2025/03/19 arXiv:2412.16504v1 chenzhuo-wang

SDBA: A Stealthy and Long-Lasting Durable Backdoor Attack in Federated Learning

联合学习是培训机器学习模型的一种有前途的方法，同时保留了数据隐私，但其分布性质使其容易受到后门攻击的影响，尤其是在NLP任务中，而相关研究仍然有限。本文介绍了SDBA，这是一种新型的后门攻击机制，专为FL环境中的NLP任务而设计。我们跨LSTM和GPT-2模型的系统分析确定了后门注入最脆弱的层，并通过层梯度遮罩和这些层中的Top-k％梯度掩盖来实现隐形和持久耐用性 ...

0 0 0 0 2025/03/18 arXiv:2409.14805v1 chenzhuo-wang

Exploring the Universal Vulnerability of Prompt-based Learning Paradigm

基于及时的学习范式弥合了预训练和微调之间的差距，并在几次射击设置下有效地工作。但是，我们发现这种学习范式从训练阶段继承了漏洞，在该阶段可以通过将某些触发器插入文本中误导模型预测。在本文中，我们通过注射后门触发器或仅使用纯文本在预训练的语言模型上搜索对抗性触发器来探讨这种通用漏洞 ...

0 0 0 0 2025/03/18 arXiv:2204.05239v1 chenzhuo-wang

PEFTGuard: Detecting Backdoor Attacks Against Parameter-Efficient Fine-Tuning

微调是一个重要的过程，可以提高特定领域中大语言模型（LLM）的性能，参数有效的微调（PEFT）由于其通过集成低级适配器而减少计算需求的能力而获得了受欢迎程度。这些轻巧的适配器（例如Lora）可以在开源平台上共享和使用。但是，对手可以利用这种机制将后部注入这些适配器，从而导致恶意行为，例如不正确或有害的产出，这对社区构成了严重的安全风险 ...

0 0 0 0 2025/03/16 arXiv:2411.17453v1 chenzhuo-wang

ELBA-Bench: An Efficient Learning Backdoor Attacks Benchmark for Large Language Models

生成的大语言模型对于自然语言处理至关重要，但是它们容易受到后门攻击的影响，在这种情况下，微妙的触发者会损害其行为。尽管对LLM的后门攻击不断出现，但现有基准在足够的攻击，度量系统完整性，后门攻击对齐方面仍然有限。由于资源访问限制，现有的预训练后门攻击是理想化的 ...

0 0 0 0 2025/03/16 arXiv:2502.18511v1 chenzhuo-wang

FATE-LLM: A Industrial Grade Federated Learning Framework for Large Language Models

近年来，大型语言模型（LLM），例如Chatgpt，Llama，Glm和Palm，在各种任务中表现出色。但是，LLMS在现实世界应用中面临两个主要挑战。一个挑战是，培训LLM会消耗大量的计算资源，从而阻止LLM被有限的计算资源的中小型企业采用 ...

0 0 0 0 2025/03/09 arXiv:2310.10049v1 chenzhuo-wang