您的位置：首页 > 科技 > 互联网 >

只需一张照片，运动视频分分钟伪造出来 | MIT新算法

来源：量子位时间：2018-06-25 16:01:10

原标题:只需一张照片，运动视频分分钟伪造出来 | MIT新算法

夏乙安妮假装发自盐湖城
量子位出品 | 公众号 QbitAI

和一键换妆、一键美颜一样，我们可能离“一键健身”不远了。

怎么说？

近日，MIT（麻省理工学院）的研究人员发明了一项新技术，单凭一张照片，就能把片中人，随意摆成任何姿势。AI的想象力和脑补力，竟然能达到窥一片而知全貌了？

没错，让人惊喜的是，这项技术的合成效果还非常好，颇有以假乱真的气势——

穿着瑜伽服打棒球？

又穿着瑜伽服打高尔夫？

棒球比赛期间突然做起瑜伽？

可能你也猜到，后面这些图都是假象，在MIT中了今年CVPR Oral的论文Synthesizing Images of Humans in Unseen Poses中，研究人员提出一种模块化的生成神经网络，用从人类运动视频中提取的成对图像和姿势训练之后，它能够为一个人合成出没做过的新姿势。

更有趣的是，这个模型在没有经过刻意训练的情况下，还能生成一段连续的视频。

只用一张照片，就能将照片中人像皮影戏一样操控，并且在被遮挡的情况下，人物和背景合成都非常自然，这到底是如何做到的？

步骤拆解

单凭一张照片合成人物姿势不是易事。姿势变换带来身体的移动，影响着人物周围的阴影变化和背景露出，若人物肢体若被遮挡，还需自行想象脑补身体边界……

总之两个字：麻烦。

对人类来说这尚且还是个繁琐复杂的工作，对AI来说更是如此。怎么办？

MIT小伙伴们用260多段视频中截取出来的成对图片和姿势，训练了一个监督学习模型。

将源图像和它对应的2D姿势信息，以及目标姿势输入到这个模型中，它就能合成出一张输出图像，把源图像上的人物形象和目标姿势结合在一起。

这个方法的精髓，就在于把这个艰巨的大任务分成四块简单的、模块化的子任务，大概如下图所示：

制造新姿势的流程分五步。

第一步得表示姿势，研究人员将2D的姿势Ps和Pt表示成3D形式RH×W×J，其中H代表输入图像的高度，W代表宽度，每个J通道都包含一个以不同节点(x,y)为中心的高斯凸起。这种方法能快速利用姿态输入的空间特性，而不仅仅是个扁平、密集的表示。

表示完动作后，就需要对图像整体大局进行原图分割，为合成动作做准备了。

运动时身体每个部分轨迹不同通常会分段仿射运动场出现，通过将原图Is分割成前景层和背景层，并将前景的身体部位分割成头、上臂、下臂、大腿、小腿和躯干等部分，基于UNet-style架构将原图分割。

之后进行前景空间变形，将这些被拆分的身体重新组合起来。

之后进行前景合成，将转换后的主体部分合并，进一步细化外观。下图显示了这个阶段的Mask Mt(第3列)和yfg(第4列)的几个输出示例。

可以看出，即使一开始是很夸张的姿势，合成出效果看起来也很真实。可惜的是，高尔夫球杆、网球拍等持有物，在合成后不会被保留。

此时，完事具备，就差背景了。背景合成也就是填补前景动作中开始被遮挡的部分，如上图第五列所示~

整个网络的架构就是这样了，接下来我们去看看研究人员具体是如何训练它的。

精挑细选的数据集

模型准备就绪，还欠数据。

于是，他们从YouTube上寻找了一些视频。其中包括136段打高尔夫的、60段练瑜伽或者健身的、70段打棒球的。

他们挑选的视频有个共同特点：背景基本静止、只有人在动。这样，模型才能更好地完成任务。

把它们混在一起，再经过一些缩放、旋转、反转之类的扩增操作，就形成了要用的数据集，从中留出10%，用作测试集。

就是用这些数据，几位科学家检验了他们模型的合成能力。

花式秀能力，开始

测试方法很简单，从视频里选一帧提取出人物的动作，找另一帧图像，让模型把里面的人扭成这个动作，看看效果如何。

作者们在论文里说：显然是我们的效果比较好嘛，有图为证。

和同行前辈UNet相比，这种新方法合成出来的图像更不容易出错。比如说上图第一行，UNet合成出来的网球少年衣服已经泛黄；第4行，健身小姐姐身后出现了重重重影。

从数据上看，这种新方法也取得了比UNet更低的错误率、更好的SSIM得分。

但这显然还不是这个模型的全部实力。

上图展示的，都是从一个网球动作到另一个网球动作，从一个健身动作到另一个健身动作，而且，还都是，静止的图像。

你大概还记得文章开头展示的那些。当然没骗你，给模型一张图片和一系列目标姿势，生成视频当然也没问题啦~

视频里的系列动作拆解开来，就是上图这样。考验眼力的时刻到了：你能猜出哪两行是真实的、哪两行是合成的吗？

答案是，1、3行是合成的动作，2、4行是真实的。

连贯起来，就是这样：

腻害~撒花！假装运动这么轻松，有视频都不一定有真相了~

Wait，这依然不是它的全部实力。

开头展示的穿着瑜伽服打棒球，当然也是它的杰作。

这个模型，可以为画中人合成不同类别的姿势。输入分别来自不同类别的源图像和目标动作，结果虽说充满违和感，但还是那么令人信服。

网球场上做瑜伽，瑜伽垫上打高尔夫……

别忘了，他们训练这个模型只用了3类运动、260多段视频，要是训练数据在充足一点，怕是真能一键假装去运动了。

传送门

这篇Synthesizing Images of Humans in Unseen Poses，被CVPR 2018作为oral论文接收，论文一作，是MIT博士后Guha Balakrishnan，他的硕士和博士学位都来自MIT。

研究团队全体成员都来自MIT，包括研究生Amy Zha、博士后Adrian V. Dalca，以及Balakrishnan的硕士和博士导师：John Guttag和Fredo Durand。

团队的另外两位成员也来自MIT，一位是研究生Amy Zhao，另一位是博士后Adrian V. Dalca。

论文：
https://arxiv.org/pdf/1804.07739.pdf

代码：
https://github.com/balakg/posewarp-cvpr2018

— 完 —

实习生招聘

量子位正在招募市场运营实习生，策划执行AI明星公司CEO、高管等参与的线上/线下活动，有机会与AI行业大牛充分交流。

工作地点在北京中关村。简历欢迎投递到quxin@qbitai.com

具体细节，请在量子位公众号(QbitAI)对话界面，回复“实习生”三个字。

量子位 QbitAI · 头条号签约作者

վ"ᴗ" ի 追踪AI技术和产品新动态

相关阅读

改革开放首批留学人员：扩大视野报效国家

06-25

江苏高考省控线公布:超六成江苏考生能考上本科

06-25

超走心！西南交大为毕业生赠送4件特殊毕业礼

06-25

各地高考分数线相继出炉北京一本理科532分

06-25

外国留学生：相离莫相忘愿做文化交流“使者”

06-25

教育部：人才培养为本本科教育是根

06-25

楼市调控持续房企竞相创新突围

06-25

希望厨房：希望工程对农村学生营养需求的回应

06-25

推荐阅读

: 两连阳为啥还没回本?买入绩优、白马、中大盘股才

一、大盘点评展望周二沪深两市小幅低开后，沪深300权重带动指数震荡上行。最终沪指上涨0 53%报收3410点，K线上收出一根中阳线;深成指上涨1 更多
2017-11-22 16:17:00

: 2017百度世界大会李彦宏透露无人车2018年量产无

一年一度的百度世界大会11月16日在北京举行，每年的百度世界大会，百度创始人李彦宏都会带来他对过去，现在和未来关于互联网和整个IT领域的更多
2017-11-16 11:17:37

: 贵州茅台股价突破700元贵州茅台股价为什么那么

今日贵州茅台延续昨日强势走势，继续大幅攀升，盘中最高价突破700元整数关口，刷新上市新高纪录，截至发稿，最高价报704 97元，总市值超越8 更多
2017-11-16 10:32:47

: 百度世界大会今日召开聚焦智能硬件百度世界大会

据怀新资讯报道，2017百度世界大会将于16日在北京举行。从邀请函上出现的神秘的盒子推测，本次百度将会有AI硬件以及诸多AI新技术发布。从今更多
2017-11-16 10:17:03

: 中国财富总值全球第二但是超4亿人家庭没有卫生厕

瑞士信贷研究所（CSRI）最新出炉的《全球财富报告》显示，全球财富总额现已达到280万亿美元，比十年前金融危机爆发时高出27%。美国占全球财更多
2017-11-16 10:07:07

: 比特币今日价格大幅反弹逾9% 比特币价格再次突破

在短短两周时间内，比特币价格呈现了非常惊险的过山车。由于对于这款加密货币未来趋势存在争议，上周比特币价格出现暴跌，曾一度低于6000美更多
2017-11-16 10:04:14

: 油价调整最新消息：国内油价今日24时或迎年内最大

新一轮成品油调价窗口将于16日24时开启。国际原油价格一度涨至近两年高位，受此影响，国内油价或迎年内最大涨幅。隆众资讯统计数据显示，以更多
2017-11-16 09:22:17

: 国际油价调整最新消息：EIA原油及汽油库存双双增

美国能源信息署（EIA）周三（11月15日）公布的数据显示，上周美国原油库存意外录得增加，同时汽油库存也意外增长。EIA公布，截至11月10日当更多
2017-11-16 09:21:49

+ 点击查看更多精彩

财经热图

国际油价调整最新消息：美国石油活跃钻井数增加9座国际油价维持上行态势

上海公共租赁房累计筹措房源超15万套魔都超详细租房攻略

多地上线官方住房租赁平台南京房价连续10个月止涨

“双十一”进入倒计时双11概念股受益股有哪些？

比特币价格站上4万元黄金被抛弃这些股票失去投资价值

国际油价调整最新消息：国际油价连续上涨布油重回60美元关口

2017福布斯中国富豪榜一览八句话速读2017福布斯富豪榜

特朗普访华最新消息：日期安排于11月8日起访华为中美关系发展创造良好机

必看

摩根大通：未来数年内监管允许的条件下将持股比例增加到100%

摩根大通：未来数年内监管允许的条件下将持股比例增加到100%

摩根大通本周宣布寻求在华建立一家持股比例为51%的全新证券公...

热门精选

24小时

一周

29日零时将上调汽柴油限价每吨汽油上调170柴油上调165元

人民网北京3月28日电 (朱江)今日，记者从隆众、卓创社会监测机构...

今年政策方向没有变，“三去一降一补”具体该怎么干？

2018年，我国开启高质量发展新征途。中央经济工作会议把深化供给...

蓝筹股带动大盘继续上攻沪指重返3400点

【盘面简述】今日早盘，随着油气股的拉升上涨，中国石油和中国石...

白马股崛起补涨强烈短期恐慌性抛盘并不大

今日市场点评：沪深两市早盘各股指纷纷小幅低开，开盘之后一度呈...

市场再度面临重要的时间窗口一板块有望迎来年末行情

【今日小结】今日，两市小幅高开，开盘回撤后快速上行翻红，金融...

不离谱的回落三理由力挺节后机会

今日市场点评：大盘在节后第一天走出了高开低走的行情。在国庆期...

国内

国际

产经

金融

精彩话题