chenzhuo-wang的文档

A Survey on Fairness in Large Language Models

大型语言模型（LLM）表现出强大的性能和发展前景，并广泛部署在现实世界中。但是，LLM可以从未经处理的培训数据中捕获社交偏见，并将偏见传播到下游任务。不公平的LLM系统具有不良的社会影响和潜在的危害 ...

0 0 0 0 2025/09/17 arXiv:2308.10149v2 chenzhuo-wang

Federated Learning from Vision-Language Foundation Models: Theoretical Analysis and Method

将概论性的视觉基础模型（如夹子）整合到联邦学习中，引起了人们的重大关注，以增强跨不同任务的概括。通常，联邦视觉学习模型采用迅速学习来降低沟通和计算成本，即 ...

0 0 0 0 2025/09/12 arXiv:2409.19610v1 chenzhuo-wang

Your fairness may vary: Pretrained language model fairness in toxic text classification

自然语言处理系统中审慎的语言模型的普及要求对下游任务中的此类模型进行仔细的评估，这些任务具有更高的社会影响潜力。对此类系统的评估通常集中在准确性措施上。我们在本文中的发现也要求注意公平措施 ...

0 0 0 0 2025/09/11 arXiv:2108.01250v3 chenzhuo-wang

AdaPPA: Adaptive Position Pre-Fill Jailbreak Attack Approach Targeting LLMs

大语模型（LLMS）中的越狱漏洞是指通过精心制作提示或后缀从模型中提取恶意内容的方法，这引起了研究界的极大关注。但是，该模型很容易检测到主要关注语义水平的传统攻击方法。这些方法忽略了在不同输出阶段的模型对齐保护功能的差异 ...

0 0 0 0 2025/09/07 arXiv:2409.07503v1 chenzhuo-wang

Deep Learning Model Inversion Attacks and Defenses: A Comprehensive Survey

在敏感领域中快速采用深度学习带来了巨大的好处。但是，这种广泛的采用也引起了严重的脆弱性，尤其是模型倒置（MI）攻击，对个人数据的隐私和完整性构成了重大威胁。这些攻击在生物识别技术，医疗保健和金融等应用中的越来越多的流行率迫切需要了解其机制，影响和防御方法 ...

0 0 0 0 2025/09/02 arXiv:2501.18934v2 chenzhuo-wang

Breaking PEFT Limitations: Leveraging Weak-to-Strong Knowledge Transfer for Backdoor Attacks in LLMs

尽管大型语言模型 (LLM) 因其卓越的功能而得到广泛应用，但已被证明容易受到后门攻击。这些攻击通过毒害训练样本和全参数微调，将有针对性的漏洞引入 LLM。然而，这种后门攻击是有限的，因为它们需要大量的计算资源，特别是随着 LLM 规模的增加 ...

0 0 0 0 2025/07/24 arXiv:2409.17946v4 chenzhuo-wang

Watch Out for Your Guidance on Generation! Exploring Conditional Backdoor Attacks against Large Language Models

主流后门对大语言模型（LLMS）的攻击通常在输入实例中设置固定的触发因素，并对触发查询的特定响应设置。但是，固定的触发设置（例如 ...

0 0 0 0 2025/07/23 arXiv:2404.14795v5 chenzhuo-wang

SABRE-FL: Selective and Accurate Backdoor Rejection for Federated Prompt Learning

联合迅速学习已成为一种沟通效率和隐私性的范式，用于调整跨分散客户的大型视觉模型，例如剪辑。但是，此设置的安全性含义仍然没有被置于不足的状态。在这项工作中，我们介绍了联合及时学习中的后门攻击的首次研究 ...

0 0 0 0 2025/07/05 arXiv:2506.22506v1 chenzhuo-wang

A Framework for Behavioral Biometric Authentication using Deep Metric Learning on Mobile Devices

使用行为生物识别技术的移动身份验证一直是研究的活跃领域。现有的研究依赖于构建机器学习分类器来识别个人的独特模式。但是，这些分类器不足以学习判别特征 ...

0 0 0 0 2025/06/30 arXiv:2005.12901v2 chenzhuo-wang

A Survey on Medical Large Language Models: Technology, Application, Trustworthiness, and Future Directions

随着大型语言模型（LLM）的出现，医疗人工智能（AI）经历了实质性的技术进步和范式转移，强调了LLMS可以简化医疗保健服务并改善患者结果的潜力。考虑到这一快速技术进步，在这项调查中，我们追踪了医学大语言模型（MED-LLMS）的最新进展，包括背景，关键发现和主流技术，尤其是从通用模型到医学专业应用程序的发展。首先，我们深入研究Med-llms的基础技术，表明如何逐步适应复杂的医疗任务 ...

0 0 0 0 2025/06/24 arXiv:2406.03712v2 chenzhuo-wang