CVPR 2022 中科院、腾讯提出LAS-AT,利用“可学习攻击策略”进行“对抗训练”

2022-03-23 10:45:27   来源:商业新知网

1 引言

由中科院,腾讯AI实验室以及香港中文大学联合出品的硬核对抗训练的新作LAS-AT发表于CVPR2022。对抗训练被认为是抵御对抗攻击最有效的防御方法,它通常会被描述为求解一个极小极大问题,其性能取决于内部优化生成对抗样本的质量。

目前在对抗训练中主流采用的攻击算法是PGD攻击,该算法需要人为手动指定攻击参数,有研究表明在对抗训练的不同阶段中固定的攻击策略会对提高模型鲁棒性带来限制。

在该论文中,作者通过引入“可学习的攻击策略”(LAS-AT)的概念,并提出了一种新的对抗训练框架,该算法框架利用强化学习机制自动生成攻击策略,从而进一步提高模型的鲁棒性。

论文: https://arxiv.org/abs/2203.06616

代码: https://github.com/jiaxiaojunQAQ/LAS-AT

2 方法概述

如下图所示为该论文的方法示意图,可以发现论文中的模型由一个目标网络和一个策略网络所组成。论文作者使用对抗样本去训练目标网络进而提高它的鲁棒性,同时策略网络生成攻击策略去生成对抗样本,由此可见这两个网络是具有竞争关系的。

目标网络: 目标网络是一个用于图像分类的卷积神经网络,可以表示为

,其中 表示的是估计标签, 是一张输入图像, 是神经网络的参数。

策略网络: 策略网络生成对抗攻击的策略进而去控制对抗样本的生成,其中输入的是一个样本,输出的是一个策略。由于策略网络的参数是逐步被更新的,在不同的训练阶段中,根据目标网络的鲁棒性的情况,给定相同的样本作为输入也会给出不同的策略。令

表示的是一种策略,其中每个元素表示的是一个攻击参数。 表示的是策略值空间,参数 有 个选项,并且被编码成one-hot向量。在不同的攻击参数下每个参数选项的意义是不同的。比如对于PGD攻击来说,它有三个攻击参数,即攻击步长的大小 ,攻击迭代数 ,以及最大的攻击扰动强度 。

每一个参数有

个可选值,比如攻击步长 的取值范围为 ,攻击迭代数 的取值范围为 。对于这些攻击参数的可选值的一个组合可以看作是一个策略。策略网络可以获得给定输入 和参数 的条件概率分布 ,其中 是输入图片, 是策略网络的参数 。

对抗样本生成器: 给定一个干净的样本,对抗样本的生成过程可以被定义为

其中

表示的是一个干净的样本, 表示的是其对应的对抗样本, 是一个攻击策略, 表示的是目标网络的参数, 表示的是PGD攻击。

3 对抗训练公式化表述

标准对抗训练有固定的攻击策略,可以表示为

其中 ,并且 表示的是人为设定的攻击策略。 是训练集, 表示的是交叉熵损失函数,其用于衡量对抗样本 的预测标签与真实标签 之间的距离。在该论文中,作者代替使用人为设定的样本不可知攻击策略,而是使用一个策略网络去自动生成基于策略 的样本。在论文中对抗训练的策略可以公式化表示为 与标准的对抗训练相比,最与众不同的地方在于对抗样本的生成方式。标准对抗训练采用的是人为设定的样本不可知的策略 去求解内部优化问题。然而论文中的作者是使用策略网络根据条件概率分布 去产生一个样本依赖策略,即作者提出的策略是可以学习的,其对抗样本的生成包含策略网络参数 ,这会导致损失函数是两个网络参数的函数。

由该论文提出的对抗训练的公式可知,目标网络和策略网络是有一种相互竞争的关系,即最小化和最大化相同的损失函数。目标网络学习调整参数去抵御对抗攻击策略生成的对抗样本,而策略网络根据给定的攻击目标网络的样本去提高攻击策略。

在一开始的训练阶段,目标网络是非常脆弱的,一个弱的攻击就可以使它分类出错,此时,策略网络可以很容易的生成有效的攻击策略,并且策略是多种多样的,因为弱的攻击策略和强的攻击策略都可以成功攻击目标网络。

随着训练过程的进行,目标网络变得越来越鲁棒,策略网络不得不去学习生成更强对抗样本的攻击策略。因此,这种博弈机制可以随着策略网络的生成策略的提高逐步促进目标网络的对抗鲁棒性。

4 损失函数项

4.1 评估鲁棒性损失

为了引导策略网络的学习,作者提出了一种新的度量方式去评估对抗攻击,主要使用的是目标网络单步更新的鲁棒性。具体地,一个攻击策略

首先被用作去创造一个对抗样本 ,并且该对抗样本通过一阶梯度下降法去单步调整目标网络的参数 。

如果更新后的目标网络能够正确预测由其它攻击策略

生成的对抗样本 的标签,则此时可以说该攻击策略是有效的。比如说对于PGD攻击,最大对抗扰动强度为8,迭代步数为10,步长为2。评估鲁棒性的损失函数可以表述为

其中 是更新目标网络的参数,

是步长。 令 , 是由攻击策略 生成的对抗样本,其主要用于评估带有参数 的目标网络的鲁棒性。 被用作去评估攻击策略,需要注意的是 不是要被优化的参数,由上公式可知, 的值越大,意味着更新后目标模型更鲁棒。

4.1 预测干净样本损失

一个好的攻击策略应该不仅可以提高目标模型的鲁棒性也能够保持预测干净样本的准确率。在该论文中作者也考虑了单步更新目标模型在预测干净样本的性能,评估攻击策略的损失函数可以被定义为

其中

是 的函数, 的数值越大,意味着更新后的目标模型在分类干净样本中有一个更低的损失值。结合以上两个损失函数项,该论文方法的对抗训练总损失函数可以表述为 其中 和 表示为 和 的权衡系数。

5 优化过程

作者提出一个算法交替优化这两个网络的损失函数。给定参数

,优化目标网络的子问题可以表述为 给定一个干净的样本,策略网络生成一个策略分布 ,从该条件分布中随机采样出一个策略,并用该策略去生成对抗样本。利用以下梯度下降法去更新目标模型的参数 其中 表示的是在一个批次中的样本数量, 表示的是学习率。给定 ,优化策略网络的参数的子问题可以描述为 其中 在这个优化问题中,最大的挑战在于对抗样本生成的过程是不可微的,即梯度信息不能通过对抗样本被反向传播到攻击策略的调整中。

另外,还有其它很多不可微的操作,如关系到对抗攻击中迭代次数的选择等,它们很难将梯度信息反向传播到策略网络中。在该论文中作者利用强学学习算法去解决以上不可微的问题,则可以计算目标函数

关于参数 的导数为 其中 ,从策略的条件分布中采样攻击策略生成对抗样本,关于参数 的近似梯度可以表示为 则策略梯度的参数可以通过梯度上升法被更新为

其中

是学习率, 和 被交替更新,其中 更新一次, 更新 次。

6 收敛性分析

假定目标函数

满足关于 和 的梯度Lipshitz条件,并且 在参数空间 中是 -强凹的。如果 是在 约束下 球的 近似解,随机梯度的方差被约束在 内,则 的学习率可以表示为 其中 是 的Lipschitz常数,并且满足如下公式 其中 表示的是最大对抗训练的轮数,并且有 。由上定理可知,内部最大化的过程可以获得对抗样本 的 近似。该论文提出的方法LAS-AT可以以学习率 收敛到一个稳定点。

另外,如果

是足够小的,论文中的方法可以找到一个理想带有参数 的鲁棒性模型,并且有一个好的对抗样本 的近似。

7 实验结果

如下两表所示,分别为不同对抗训练的方法在数据集CIFAR10和CIFAR100的鲁棒性的对比结果。可以直观的发现,在大多数攻击场景下,论文中三种方法对抗训练出的模型的性能都优于其它方法对抗训练出的模型,而且在很多情况下,论文中的方法不仅提高了基础模型的鲁棒性,而且提高了干净样本分类的精度。

作者将论文中方法与其他超参数搜索方法进行了比较,包括经典的超参数搜索方法(随机搜索)和两种自动超参数搜索方法。从下图可以看出,论文中方法实现了在所有攻击场景下对抗训练出的模型都达到了最佳的鲁棒性性能。

为了研究LAS-AT的工作原理,作者分析了策略网络在不同训练阶段的攻击策略分布。最大扰动强度的范围设定为3到15,如下图所示为对抗训练期间最大扰动强度的分布演变情况。

在对抗训练开始时,分布覆盖了最大扰动强度的所有可选值。每个值都有选择的机会,这确保了对抗样本的多样性。随着对抗训练的进行,小扰动强度的百分比降低。在后期,最大扰动强度的分布被几个大值占据。

这一现象表明,策略网络逐渐增加大扰动强度的百分比,以生成更强的对抗扰动,进而目标网络的鲁棒性通过使用强对抗样本进行训练而逐渐增强。

关键词: 表示的是 损失函数

上一篇:
下一篇:
精彩阅读

CVPR 2022 中科院、腾讯提出LAS-AT,利用“可学习攻击策略”进行“对抗训练”

热点

由中科院,腾讯AI实验室以及香港中文大学联合出品的硬核对抗训练的新作LAS-AT发表于CVPR2022。

数实相融 浪潮信息策马扬鞭奔向“绿色未来”

热点

计算力就是生产力,这无疑是人类社会发展过程当中因技术创新而带来的时代变化。

钉钉开始直面商业化

热点

钉钉在今天用线上的方式举办了2022年最重要的发布会——“科技向实万物生长”2022钉钉发布会。

工信部:截至2月底,IPTV总用户数达3.57亿户

热点

3月21日,工信部运行监测协调局发布2022年1—2月份通信业经济运行情况。

四家运营商薪资福利大对比,谁能更胜一筹?

热点

中国移动、中国电信、中国联通、中国铁塔纷纷携下属子公司和专业机构,启动2022年度校园招聘活动。

彻底告别“个性化体验”,隐私和体验哪个重要?

热点

算法本身是没有问题的,但如何在用户满意度和产品核心竞争力之间取得一个平衡,才是当下开发者们应该重视的点。

清华大学孙茂松:自然语言处理一瞥,知往鉴今瞻未来

热点

自然语言处理一路走来至今日,形成了“力大者为王”和“智深者为上”两条道路。

“山金云”助推山东省数字经济发展

热点

山东黄金集团“山金云”作为典型案例,面向全省进行数字化建设经验介绍。

财富

315曝光台:美团、去哪儿相继被曝出大数据“杀熟”

资讯

近日,315曝光台上,美团和去哪儿相继被曝出大数据杀熟。今年3月3日,一位匿名用户在黑猫平台 上对在线旅游平台去哪儿发起投诉,他已经在

大数据时代,如何保护个人信息?

资讯

一、大数据时代个人隐私数据泄露已成为全球重大的社会问题随着信息技术的飞速发展,数据化生存已逐渐成为人类社会运行的常态,数据在公共管

3月LPR报价公布:1年期3.7%5年期以上4.6%

资讯

3月LPR(贷款市场报价利率)如期公布。3月21日,中国人民银行授权全国银行间同业拆借中心公布,2022年3月21日LPR):1年期为3 7%,5年期以上为

郭明錤:iPhone14系列“新瓶旧酒”是一种营销策略

资讯

郭明錤认为,iPhone 14系列新瓶旧酒的做法,其实是一种营销策略和财务导向的决策。3月20日消息,天风国际分析师郭明錤在社交媒体表示,iPh

猝不及防!比亚迪、小鹏等车企宣布涨价

资讯

这波新能源汽车涨价潮让人猝不及防。比亚迪、小鹏等车企宣布涨价之后,昨晚也在官网宣布,将对在售车型价格进行调整,综合补贴后售价上调幅

特斯拉推送四大新功能:空调功能更新、新增语言支持

资讯

近日,特斯拉推送了2022 8 2版本OTA升级,带来了四大新功能,包括空调功能更新、更加精准的预计充电时间、正在进行的通话更新、以及新增语

企业:做电商专供家电是为了渠道差异化

资讯

在嗅觉敏锐的华强北商人眼中,食品正在成为这里的新标签。3月2日,时代财经来到深圳华强北实地探访发现,华强北的几大主要商场如今都已有了

做不做高端,厨电企业摁下“高端键”背后有何深意?

资讯

中国人对厨房和烹饪的关注历史是源远流长的,一张餐桌的背后演绎着国民经济的发展脉络,也展示着居民生活水平的不断提高,而对于厨电企业而

清洁电器行业又迎来新品类,如何布局?

资讯

继洗地机之后,清洁电器行业又迎来了一个新品类。近期,中国家电网记者注意到了某品牌推出了一款名为多功能蒸汽清洁器的产品,据了解该产品

废旧家电回收体系亟待完善

资讯

我国家电行业已从增量市场转为存量市场,家电保有量已超过21亿台。如今我国家电需求以换新为主,每销售一台家电新品就要处理一台废旧电器,

数实相融 浪潮信息策马扬鞭奔向“绿色未来”

计算力就是生产力,这无疑是人类社会发展过程当中因技术创新而带来的时代变化。

钉钉开始直面商业化

钉钉在今天用线上的方式举办了2022年最重要的发布会——“科技向实万物生长”2022钉钉发布会。

工信部:截至2月底,IPTV总用户数达3.57亿户

3月21日,工信部运行监测协调局发布2022年1—2月份通信业经济运行情况。

四家运营商薪资福利大对比,谁能更胜一筹?

中国移动、中国电信、中国联通、中国铁塔纷纷携下属子公司和专业机构,启动2022年度校园招聘活动。

为户外劳动者提供便利 重庆已建成665座“劳动者港湾”

  中新网重庆4月22日电 (韩璐 王雪宇)记者22日从重庆市城市管理局获悉,2020年重庆市已建成“劳动者港湾”665座。今年,重庆还将继续建

沈阳警方侦破特大贩卖毒品案 抓获88名涉毒违法犯罪嫌疑人

  中新社沈阳4月22日电 (王景巍)沈阳市公安局22日发布消息,近日,在中国公安部和辽宁省公安厅的指导协调下,历经9个多月,沈阳市公安局

上海警方侦破特大制售假普洱茶案 市场价值高达18亿元

  中新网上海4月22日电 (记者 李姝徵)记者22日从上海警方获悉,2021年3月,上海警方全链条侦破一起销售假冒知名品牌普洱茶案,捣毁制售

西安强化知识产权司法保护 商标权案件占比高

  中新网西安4月22日电 (记者 张一辰)在世界知识产权日即将到来之际,西安市中级人民法院(以下简称:西安中院)22日召开新闻发布会,发

今年5月至明年2月底 江西4A级及以上景区对全国学子免门票

  中新网南昌4月22日电 (记者 李韵涵)记者22日从“红五月·嘉游赣”江西五一假日旅游工作媒体吹风会上获悉,2021年5月1日至2022年2月28

福州乡村公益图书馆:图书“接地气” 门口即是农田

  中新网福州4月22日电 (叶秋云 曾路淇)世界读书日即将来临之际,驾车五十余分钟,记者来到距离福建省福州市30多公里的闽侯县白沙镇马