arxiv Backdoor Attacks and Countermeasures in Natural Language Processing Models: A Comprehensive Security Review

名称
Backdoor Attacks and Countermeasures in Natural Language Processing Models: A Comprehensive Security Review
首页
https://yiyibooks.cn/arxiv/2309.06055v5/index.html
原始地址
https://arxiv.org/pdf/2309.06055
描述
语言模型 (LM) 在现实应用中变得越来越流行。将模型训练和数据托管外包给第三方平台已成为降低成本的标准方法。在这种情况下,攻击者可以操纵训练过程或数据,将后门注入模型中 ...