TextLeak:基于决策的单词级黑盒文本对抗攻击方法
武汉大学学报(理学版)
页数: 10 2023-06-27
摘要: 现有的基于决策的黑盒文本对抗攻击方案无法兼顾攻击效果和攻击效率,因此,提出了一种简单而高效的基于决策的单词级黑盒文本对抗攻击方法 TextLeak。该方法的核心思想是通过多级搜索的方式寻找最小扰动以生成对抗样本,即先通过粗粒度搜索确定目标区域,然后基于该目标区域通过细粒度搜索找到最优解作为对抗样本。以攻击成功率、扰动率以及查询次数为主要评估指标,在相同的数据集和模型下,选取了三... (共10页)