首页> 热点 >

CVPR 2022 中科院、腾讯提出LAS-AT，利用“可学习攻击策略”进行“对抗训练”

2022-03-23 10:45:27 来源：商业新知网

▊ 1 引言

由中科院，腾讯AI实验室以及香港中文大学联合出品的硬核对抗训练的新作LAS-AT发表于CVPR2022。对抗训练被认为是抵御对抗攻击最有效的防御方法，它通常会被描述为求解一个极小极大问题，其性能取决于内部优化生成对抗样本的质量。

目前在对抗训练中主流采用的攻击算法是PGD攻击，该算法需要人为手动指定攻击参数，有研究表明在对抗训练的不同阶段中固定的攻击策略会对提高模型鲁棒性带来限制。

在该论文中，作者通过引入“可学习的攻击策略”（LAS-AT）的概念，并提出了一种新的对抗训练框架，该算法框架利用强化学习机制自动生成攻击策略，从而进一步提高模型的鲁棒性。

论文： https://arxiv.org/abs/2203.06616

代码： https://github.com/jiaxiaojunQAQ/LAS-AT

▊ 2 方法概述

如下图所示为该论文的方法示意图，可以发现论文中的模型由一个目标网络和一个策略网络所组成。论文作者使用对抗样本去训练目标网络进而提高它的鲁棒性，同时策略网络生成攻击策略去生成对抗样本，由此可见这两个网络是具有竞争关系的。

目标网络：目标网络是一个用于图像分类的卷积神经网络，可以表示为

，其中表示的是估计标签，是一张输入图像，是神经网络的参数。
策略网络：策略网络生成对抗攻击的策略进而去控制对抗样本的生成，其中输入的是一个样本，输出的是一个策略。由于策略网络的参数是逐步被更新的，在不同的训练阶段中，根据目标网络的鲁棒性的情况，给定相同的样本作为输入也会给出不同的策略。令
表示的是一种策略，其中每个元素表示的是一个攻击参数。表示的是策略值空间，参数有个选项，并且被编码成one-hot向量。在不同的攻击参数下每个参数选项的意义是不同的。比如对于PGD攻击来说，它有三个攻击参数，即攻击步长的大小，攻击迭代数，以及最大的攻击扰动强度。
每一个参数有
个可选值，比如攻击步长的取值范围为，攻击迭代数的取值范围为。对于这些攻击参数的可选值的一个组合可以看作是一个策略。策略网络可以获得给定输入和参数的条件概率分布，其中是输入图片，是策略网络的参数。
对抗样本生成器：给定一个干净的样本，对抗样本的生成过程可以被定义为
其中
表示的是一个干净的样本，表示的是其对应的对抗样本，是一个攻击策略，表示的是目标网络的参数，表示的是PGD攻击。
▊ 3 对抗训练公式化表述
标准对抗训练有固定的攻击策略，可以表示为
其中，并且表示的是人为设定的攻击策略。是训练集，表示的是交叉熵损失函数，其用于衡量对抗样本的预测标签与真实标签之间的距离。在该论文中，作者代替使用人为设定的样本不可知攻击策略，而是使用一个策略网络去自动生成基于策略的样本。在论文中对抗训练的策略可以公式化表示为与标准的对抗训练相比，最与众不同的地方在于对抗样本的生成方式。标准对抗训练采用的是人为设定的样本不可知的策略去求解内部优化问题。然而论文中的作者是使用策略网络根据条件概率分布去产生一个样本依赖策略，即作者提出的策略是可以学习的，其对抗样本的生成包含策略网络参数，这会导致损失函数是两个网络参数的函数。
由该论文提出的对抗训练的公式可知，目标网络和策略网络是有一种相互竞争的关系，即最小化和最大化相同的损失函数。目标网络学习调整参数去抵御对抗攻击策略生成的对抗样本，而策略网络根据给定的攻击目标网络的样本去提高攻击策略。
在一开始的训练阶段，目标网络是非常脆弱的，一个弱的攻击就可以使它分类出错，此时，策略网络可以很容易的生成有效的攻击策略，并且策略是多种多样的，因为弱的攻击策略和强的攻击策略都可以成功攻击目标网络。
随着训练过程的进行，目标网络变得越来越鲁棒，策略网络不得不去学习生成更强对抗样本的攻击策略。因此，这种博弈机制可以随着策略网络的生成策略的提高逐步促进目标网络的对抗鲁棒性。
▊ 4 损失函数项
4.1 评估鲁棒性损失
为了引导策略网络的学习，作者提出了一种新的度量方式去评估对抗攻击，主要使用的是目标网络单步更新的鲁棒性。具体地，一个攻击策略
首先被用作去创造一个对抗样本，并且该对抗样本通过一阶梯度下降法去单步调整目标网络的参数。
如果更新后的目标网络能够正确预测由其它攻击策略
生成的对抗样本的标签，则此时可以说该攻击策略是有效的。比如说对于PGD攻击，最大对抗扰动强度为8，迭代步数为10，步长为2。评估鲁棒性的损失函数可以表述为
其中是更新目标网络的参数，
是步长。令，是由攻击策略生成的对抗样本，其主要用于评估带有参数的目标网络的鲁棒性。被用作去评估攻击策略，需要注意的是不是要被优化的参数，由上公式可知，的值越大，意味着更新后目标模型更鲁棒。
4.1 预测干净样本损失
一个好的攻击策略应该不仅可以提高目标模型的鲁棒性也能够保持预测干净样本的准确率。在该论文中作者也考虑了单步更新目标模型在预测干净样本的性能，评估攻击策略的损失函数可以被定义为
其中
是的函数，的数值越大，意味着更新后的目标模型在分类干净样本中有一个更低的损失值。结合以上两个损失函数项，该论文方法的对抗训练总损失函数可以表述为其中和表示为和的权衡系数。
▊ 5 优化过程
作者提出一个算法交替优化这两个网络的损失函数。给定参数
，优化目标网络的子问题可以表述为给定一个干净的样本，策略网络生成一个策略分布，从该条件分布中随机采样出一个策略，并用该策略去生成对抗样本。利用以下梯度下降法去更新目标模型的参数其中表示的是在一个批次中的样本数量，表示的是学习率。给定，优化策略网络的参数的子问题可以描述为其中在这个优化问题中，最大的挑战在于对抗样本生成的过程是不可微的，即梯度信息不能通过对抗样本被反向传播到攻击策略的调整中。
另外，还有其它很多不可微的操作，如关系到对抗攻击中迭代次数的选择等，它们很难将梯度信息反向传播到策略网络中。在该论文中作者利用强学学习算法去解决以上不可微的问题，则可以计算目标函数
关于参数的导数为其中，从策略的条件分布中采样攻击策略生成对抗样本，关于参数的近似梯度可以表示为则策略梯度的参数可以通过梯度上升法被更新为
其中
是学习率，和被交替更新，其中更新一次，更新次。
▊ 6 收敛性分析
假定目标函数
满足关于和的梯度Lipshitz条件，并且在参数空间中是 -强凹的。如果是在约束下球的近似解，随机梯度的方差被约束在内，则的学习率可以表示为其中是的Lipschitz常数，并且满足如下公式其中表示的是最大对抗训练的轮数，并且有。由上定理可知，内部最大化的过程可以获得对抗样本的近似。该论文提出的方法LAS-AT可以以学习率收敛到一个稳定点。
另外，如果
是足够小的，论文中的方法可以找到一个理想带有参数的鲁棒性模型，并且有一个好的对抗样本的近似。
▊ 7 实验结果
如下两表所示，分别为不同对抗训练的方法在数据集CIFAR10和CIFAR100的鲁棒性的对比结果。可以直观的发现，在大多数攻击场景下，论文中三种方法对抗训练出的模型的性能都优于其它方法对抗训练出的模型，而且在很多情况下，论文中的方法不仅提高了基础模型的鲁棒性，而且提高了干净样本分类的精度。
作者将论文中方法与其他超参数搜索方法进行了比较，包括经典的超参数搜索方法（随机搜索）和两种自动超参数搜索方法。从下图可以看出，论文中方法实现了在所有攻击场景下对抗训练出的模型都达到了最佳的鲁棒性性能。
为了研究LAS-AT的工作原理，作者分析了策略网络在不同训练阶段的攻击策略分布。最大扰动强度的范围设定为3到15，如下图所示为对抗训练期间最大扰动强度的分布演变情况。
在对抗训练开始时，分布覆盖了最大扰动强度的所有可选值。每个值都有选择的机会，这确保了对抗样本的多样性。随着对抗训练的进行，小扰动强度的百分比降低。在后期，最大扰动强度的分布被几个大值占据。
这一现象表明，策略网络逐渐增加大扰动强度的百分比，以生成更强的对抗扰动，进而目标网络的鲁棒性通过使用强对抗样本进行训练而逐渐增强。

关键词：表示的是损失函数

上一篇：
下一篇：

精彩阅读

CVPR 2022 中科院、腾讯提出LAS-AT，利用“可学习攻击策略”进行“对抗训练”
热点
由中科院，腾讯AI实验室以及香港中文大学联合出品的硬核对抗训练的新作LAS-AT发表于CVPR2022。

“热钱”洒向数据库，耐力比拼进行时
热点
道阻且艰，行则将至。

数实相融浪潮信息策马扬鞭奔向“绿色未来”
热点
计算力就是生产力，这无疑是人类社会发展过程当中因技术创新而带来的时代变化。

钉钉开始直面商业化
热点
钉钉在今天用线上的方式举办了2022年最重要的发布会——“科技向实万物生长”2022钉钉发布会。

工信部：截至2月底，IPTV总用户数达3.57亿户
热点
3月21日，工信部运行监测协调局发布2022年1—2月份通信业经济运行情况。

四家运营商薪资福利大对比，谁能更胜一筹？
热点
中国移动、中国电信、中国联通、中国铁塔纷纷携下属子公司和专业机构，启动2022年度校园招聘活动。

彻底告别“个性化体验”，隐私和体验哪个重要？
热点
算法本身是没有问题的，但如何在用户满意度和产品核心竞争力之间取得一个平衡，才是当下开发者们应该重视的点。

清华大学孙茂松：自然语言处理一瞥，知往鉴今瞻未来
热点
自然语言处理一路走来至今日，形成了“力大者为王”和“智深者为上”两条道路。

网传字节跳动调高 Pico VR 今年销售目标至 180 万台；罗永浩微博发文，澄清《罗永浩“真还传”大结局》多处事实错误
热点
网传字节跳动调高PicoVR今年销售目标至180万台。

“山金云”助推山东省数字经济发展
热点
山东黄金集团“山金云”作为典型案例，面向全省进行数字化建设经验介绍。

财富

315曝光台：美团、去哪儿相继被曝出大数据“杀熟”
资讯
近日，315曝光台上，美团和去哪儿相继被曝出大数据杀熟。今年3月3日，一位匿名用户在黑猫平台上对在线旅游平台去哪儿发起投诉，他已经在

大数据时代，如何保护个人信息？
资讯
一、大数据时代个人隐私数据泄露已成为全球重大的社会问题随着信息技术的飞速发展，数据化生存已逐渐成为人类社会运行的常态，数据在公共管

3月LPR报价公布：1年期3.7%5年期以上4.6%
资讯
3月LPR(贷款市场报价利率)如期公布。3月21日，中国人民银行授权全国银行间同业拆借中心公布，2022年3月21日LPR)：1年期为3 7%，5年期以上为

郭明錤：iPhone14系列“新瓶旧酒”是一种营销策略
资讯
郭明錤认为，iPhone 14系列新瓶旧酒的做法，其实是一种营销策略和财务导向的决策。3月20日消息，天风国际分析师郭明錤在社交媒体表示，iPh

猝不及防！比亚迪、小鹏等车企宣布涨价
资讯
这波新能源汽车涨价潮让人猝不及防。比亚迪、小鹏等车企宣布涨价之后，昨晚也在官网宣布，将对在售车型价格进行调整，综合补贴后售价上调幅

特斯拉推送四大新功能：空调功能更新、新增语言支持
资讯
近日，特斯拉推送了2022 8 2版本OTA升级，带来了四大新功能，包括空调功能更新、更加精准的预计充电时间、正在进行的通话更新、以及新增语

企业：做电商专供家电是为了渠道差异化
资讯
在嗅觉敏锐的华强北商人眼中，食品正在成为这里的新标签。3月2日，时代财经来到深圳华强北实地探访发现，华强北的几大主要商场如今都已有了

做不做高端，厨电企业摁下“高端键”背后有何深意？
资讯
中国人对厨房和烹饪的关注历史是源远流长的，一张餐桌的背后演绎着国民经济的发展脉络，也展示着居民生活水平的不断提高，而对于厨电企业而

清洁电器行业又迎来新品类，如何布局？
资讯
继洗地机之后，清洁电器行业又迎来了一个新品类。近期，中国家电网记者注意到了某品牌推出了一款名为多功能蒸汽清洁器的产品，据了解该产品

废旧家电回收体系亟待完善
资讯
我国家电行业已从增量市场转为存量市场，家电保有量已超过21亿台。如今我国家电需求以换新为主，每销售一台家电新品就要处理一台废旧电器，

MORE+ 资讯

微博接入TopHolder，数字藏品走向社交化？

中概股暴跌后的大厂员工：230万缩水至23万、和家人一起“开源节流”

首发丨「深视科技」完成千万美元A轮融资，创世伙伴、苏高新集团融享创投领投

降价、降估值，新茶饮「降温」

奶茶卷到美国，卷入TikTok

小米的高端化，不能只靠米粉

一键关闭，再见了，烦人的APP广告

餐饮探店营销乱象频生，是流量密码还是饮鸩止渴？

上海买菜实录：有人在凌晨12点鏖战，有人在早上6点激情下单

一娃一屋，管家伴读，高档酒店「网课房」谁去住？

MORE+ 热点

CVPR 2022 中科院、腾讯提出LAS-AT，利用“可学习攻击策略”进行“对抗训练”

“热钱”洒向数据库，耐力比拼进行时

道阻且艰，行则将至。

数实相融浪潮信息策马扬鞭奔向“绿色未来”

计算力就是生产力，这无疑是人类社会发展过程当中因技术创新而带来的时代变化。

钉钉开始直面商业化

钉钉在今天用线上的方式举办了2022年最重要的发布会——“科技向实万物生长”2022钉钉发布会。

工信部：截至2月底，IPTV总用户数达3.57亿户

3月21日，工信部运行监测协调局发布2022年1—2月份通信业经济运行情况。

四家运营商薪资福利大对比，谁能更胜一筹？

中国移动、中国电信、中国联通、中国铁塔纷纷携下属子公司和专业机构，启动2022年度校园招聘活动。

MORE+ 焦点

为户外劳动者提供便利重庆已建成665座“劳动者港湾”

　　中新网重庆4月22日电 (韩璐王雪宇)记者22日从重庆市城市管理局获悉，2020年重庆市已建成“劳动者港湾”665座。今年，重庆还将继续建

沈阳警方侦破特大贩卖毒品案抓获88名涉毒违法犯罪嫌疑人

　　中新社沈阳4月22日电 (王景巍)沈阳市公安局22日发布消息，近日，在中国公安部和辽宁省公安厅的指导协调下，历经9个多月，沈阳市公安局

上海警方侦破特大制售假普洱茶案市场价值高达18亿元

　　中新网上海4月22日电 (记者李姝徵)记者22日从上海警方获悉，2021年3月，上海警方全链条侦破一起销售假冒知名品牌普洱茶案，捣毁制售

西安强化知识产权司法保护商标权案件占比高

　　中新网西安4月22日电 (记者张一辰)在世界知识产权日即将到来之际，西安市中级人民法院(以下简称：西安中院)22日召开新闻发布会，发

今年5月至明年2月底江西4A级及以上景区对全国学子免门票

　　中新网南昌4月22日电 (记者李韵涵)记者22日从“红五月·嘉游赣”江西五一假日旅游工作媒体吹风会上获悉，2021年5月1日至2022年2月28

福州乡村公益图书馆：图书“接地气” 门口即是农田

　　中新网福州4月22日电 (叶秋云曾路淇)世界读书日即将来临之际，驾车五十余分钟，记者来到距离福建省福州市30多公里的闽侯县白沙镇马

MORE+ 智能

年内五连涨！2022款欧拉好猫全系车型价格调整

Q-CTRL：量子计算算法成功率提高1000倍以上

韩媒：三星被限制旗下GalaxyS22手机游戏性能

人才缺口高达500万！人工智能行业“抢人大战”来了

专家警告：未来机器学习可能被专业的攻击者利用

联发科：天玑9000终端Q1上市能效提升37%

微软发布补丁 CVE-2022-21907的概念验证代码也被发布

Pixel Buds A获固件更新：将尝试改善低音和高音

西南五省份推进政务服务跨省通办涉及户籍证明、电子监控违法处理

0糖0卡0添加到底是什么概念？这里面有不少门道

精彩推送

CVPR 2022 中科院、腾讯提出LAS-AT，利用“可学习攻击策略”进行“对抗训练”

“热钱”洒向数据库，耐力比拼进行时

数实相融浪潮信息策马扬鞭奔向“绿色未来”

四家运营商薪资福利大对比，谁能更胜一筹？

彻底告别“个性化体验”，隐私和体验哪个重要？

工信部：截至2月底，IPTV总用户数达3.57亿户

钉钉开始直面商业化

中概股暴跌后的大厂员工：230万缩水至23万、和家人一起“开源节流”

微博接入TopHolder，数字藏品走向社交化？

首发丨「深视科技」完成千万美元A轮融资，创世伙伴、苏高新集团融享创投领投

降价、降估值，新茶饮「降温」

餐饮探店营销乱象频生，是流量密码还是饮鸩止渴？

一键关闭，再见了，烦人的APP广告

小米的高端化，不能只靠米粉

奶茶卷到美国，卷入TikTok

上海买菜实录：有人在凌晨12点鏖战，有人在早上6点激情下单

内卷的智能投影，奋力抓住年轻人

“春天的蔬菜100元一斤，才知道原来我只配吃肉”

一娃一屋，管家伴读，高档酒店「网课房」谁去住？

融资丨「小鸟健康」完成两轮近亿元融资

融资丨「普立蒙」完成近亿元新一轮融资，雅惠投资领投

海外创投丨社交APP「WeAre8」完成1500万美元B轮融资，Channel 4 Ventures、Centerstone Capital联合投资

融资丨「melt season」完成超千万元天使轮融资，Breeze Capital领投

融资丨「天云数据」完成数亿元D轮融资，多家国家队基金共同投资

清华大学孙茂松：自然语言处理一瞥，知往鉴今瞻未来

融资丨「喜屏传媒」完成B轮融资，阿里巴巴独家投资

“山金云”助推山东省数字经济发展

美国要切断对俄罗斯的GPS服务？“北斗”可否顶上？

人工智能、机器学习、深度学习的关系，终于有人讲明白了

微软警告：不支持的硬件上安装Windows11

网传字节跳动调高 Pico VR 今年销售目标至 180 万台；罗永浩微博发文，澄清《罗永浩“真还传”大结局》多处事实错误

五年后，元宇宙中的网络安全如何保障？

315曝光台：美团、去哪儿相继被曝出大数据“杀熟”

数据的历史与发展

【数据分析】如何增强客户忠诚度？

13.4亿个账号被处置，2022年“清朗”行动还将重点整治这些乱象！

企业使用云计算管理大数据，需要注意哪些漏洞？

大数据时代，如何保护个人信息？

万门大学倒闭了，童哲连夜跑路了

价格战来了，乐乐茶“被迫”降价？

科技活动中的“领域变迁”和“关键变迁”

天云数据完成数亿元D轮融资，重新定义数据基础设施 | 华映portfolio

教你如何摘取区块链中的明珠 - 智能合约

诈骗、灰产、荷尔蒙，畸形生态下养活的陌陌、探探和Soul

“数字员工”已悄然登场，将带来怎样一场变革？

苦“大数据推荐”久矣？现在终于可以关掉它了！

数字经济的内涵、界定和各国规模测算

钉钉总裁叶军：发布酷应用，钉钉只做一件事就是PaaS化

大数据“杀熟”？新规出手了！

54岁医药老兵三次创业，9年专攻病毒载体，今日收获IPO

“AI+知识管理”为企业数智升级注入新动力

CRM讲堂 - 不要让CRM沦为监管销售的工具

工信部：三大运营商发展蜂窝物联网终端用户数达到14.64亿

钉钉发布新logo：从要规模到要价值，品牌新主张让进步发生

融资丨「悬镜安全」完成数亿元B轮融资，源码资本领投

锤子科技撤回全部破产申请，罗永浩或将重回科技行业

3月LPR报价公布：1年期3.7%5年期以上4.6%

“东数西算”夯实数字经济绿色底座

调查：Coinbase 与 Binance 上新币种

NFT｜无聊猿（BAYC）的发展潜力（一）

中国联通倾力打造高算力枢纽节点！

“元宇宙”破圈爆红，区块链成为幕后推手

电信和联通如何抗衡一家独大的中移动？

再见3G：多运营商关闭UMTS和CDMA2000网络

第二人生的创始人菲利普·罗斯戴尔对元宇宙发出了与Meta截然相反的概念

新茶饮“下凡” 一点点们“瑟瑟发抖”

固若金汤的App Store审核也翻车了吗？

疯狂涨价，电动车梦碎2022？

2021年全球手机畅销榜单出炉，你看懂了吗？

小镇青年，要对电动车下手了

曹德旺输了，福建人没输

张朝阳好为人师，搜狐视频战术躺平

抖音探店，中间商割韭菜

还记得威马吗？

降价、裁员、关店，新茶饮风向生变？

给食堂“送菜”，年销售百亿，高瓴红杉低调押注丨专访彩食鲜CEO李建波

蝙蝠侠不吃爆米花

融资丨「派学车」完成亿元C2轮融资，达晨财智领投

关于中国企业家网“罗永浩‘真还传’大结局”报道的澄清

现在是投资中国互联网公司的好时候吗？

科学家称或存在时间倒流反宇宙

Figma封不住国产软件崛起的步伐

联邦知识蒸馏概述与思考（续）

打造酒类新零售界的“丝芙兰”，酒廷1990想怎么做？

房地产公司抢着送钱，既便宜又不卡脖子，钠电池要火了？

AI靠语意理解把照片变抽象画，无需相应数据集，只画4笔也保留神韵，有毕加索内味儿了

Marteker 日报：(2022.3.21)

详解ID拉通 | CDP 智库系列文章 ②

“AI+知识管理”为企业数智升级注入新动力

郭明錤：iPhone14系列“新瓶旧酒”是一种营销策略

年内五连涨！2022款欧拉好猫全系车型价格调整

猝不及防！比亚迪、小鹏等车企宣布涨价

全行业攻坚智能网联汽车安全

特斯拉推送四大新功能：空调功能更新、新增语言支持

NFT与元宇宙热度回撤，阵痛之后何去何从？

特斯拉推送四大新功能：空调功能更新、新增语言支持

谷歌新操作系统曝光：屏幕底部有任务栏

抢先苹果！罗永浩“真还传”下月完结：即将进军VR行业

瑞数信息荣膺CCIA2021年度优秀会员单位

深度视觉宣布完成过亿元A轮融资，将用于产品研发和市场拓展等