- 1、本文档共6页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
007|精读2017年ICCV最佳研究论文
2018-01-22洪亮劼来自北京
《AI技术内参》
ICCV(InternationalConferenceonComputerVision,国际计算机视觉大会),是每两年
举办一次的计算机视觉顶级会议。从1987年开始举办,已经有30年的历史。2017年的
ICCV大会于10月22日至29日在意大利的水城威尼斯举行。
在每届ICCV大会上,都会从众多学术论文中挑选出两篇最有新意和价值的论文作为最佳研究
论文和最佳学生论文。ICCV的最佳论文奖又叫作“马尔奖项”(MarrPrize),是为了纪念
英国的心理学家和神经科学家大卫·马尔(DavidMarr)而设计的奖项。马尔将心理学、人工
智能和神经生理学的研究成果结合起来,提出了全新的关于视觉处理的理论,他被认为是计算
神经科学的创始人。
今天,我就来带你认真剖析一下ICCV2017年的最佳研究论文“MaskR-CNN”。这篇论
文是一个集大成的工作,介绍了一个新的方法可以用于同时解决图像的“物体识别”(Object
Detection)、“语义分割”(SemanticSegmentation)和“数据点分割”(Instance
Segmentation)的工作。
什么意思呢?通俗地讲,那就是给定一个输入的图像,利用这篇论文提出的模型可以分析这个
图像里究竟有哪些物体,比如是一只猫,还是一条狗;同时能够定位这些物体在整个图像中的
位置;并且还能针对图像中的每一个像素,知道其属于哪一个物体,也就是我们经常所说的,
把物体从图像中“抠”出来。
作者群信息介绍
这篇论文的作者全部来自Facebook的人工智能研究院(FacebookAIResearch)。
第一作者就是近几年在计算机视觉领域升起的学术之星何恺明博士(KaimingHe)。他于
2016年加入Facebook人工智能研究院,之前在微软亚洲研究院进行计算机视觉的研究工
作;他还是CVPR2016年和CVPR2009年的最佳论文得主。目前,何恺明在计算机视觉领
域有三项重大贡献。
第一,他与其他合作者发明的ResNet从2016年以来成为了计算机视觉深度学习架构中的重
要力量,被应用到了计算机视觉以外的一些领域,比如机器翻译和AlphaGo等,相关论文引
用数超过5千次。
第二,他与其他合作者开发的FasterR-CNN技术,发表于NIPS2015上,是图像物体识别
和语义分析的重要技术手段,也是今天我们要讨论的这篇论文的基础,论文引用数超过2千
次。
第三,他与其他合作者在ICCV2015年发表论文《深入研究整流器:在ImageNet分类上超
越人类水平》(DelvingDeepintoRectifiers:SurpassingHuman-LevelPerformance
onImageNetClassification),研究了一种改进的ReLU(RectifiedLinearUnit,线性整
流函数,又称修正线性单元)结构从而达到了更好的效果,论文引用数近2千次。
第二作者乔治亚⋅吉克里奥夏里(GeorgiaGkioxari)目前是Facebook人工智能研究院的博
士后研究员。乔治亚可以说是师出名门,在Facebook工作之前才从加州大学伯克利毕业,师
从计算机视觉泰斗吉腾德拉⋅马利克(JitendraMalik)。乔治亚之前还分别在谷歌大脑和谷歌
研究院实习过。在过去几年中,乔治亚在计算机视觉界已经发表了多篇高质量论文。
第三作者皮奥特⋅多拉(PiotrDollár)是Facebook人工智能研究院的一名经理。2007年从
加州大学圣地亚哥分校获得博士学位,2014年加入Facebook,这之前在微软研究院工作。
皮奥特长期从事计算机视觉的研究工作。
最后一个作者罗斯⋅吉尔什克(RossGirshick)是Facebook人工智能研究院的一名科学家。
他于2012年毕业于芝加哥大学,获得计算机博士。罗斯之前也在微软研究院工作,也曾在计
算机视觉泰斗吉腾德拉的实验室里担任博士后的研究工作。
论文的主要贡献
我们首先来看一下这篇文章的主要贡献。还是要先去理解,这篇文章主要解决的是一个什么场
景下的问题。
刚才我们已经简单地谈到了,这篇文章要解决的问题,就是对输入图像的物体识别、语义分
割,以及数据点分割,是这三个任务的一个集成。在之前的一个工作中,“FasterR-
您可能关注的文档
- 出口商品技术指南-木制品(1).pdf
- 002-精读2017年KDD最佳研究论文【萌萌家】(1).pdf
- 003-精读2017年KDD最佳应用数据科学论文【萌萌家】.pdf
- 013-WSDM2018论文精读:看谷歌团队如何做位置偏差估计【萌萌家】.pdf
- 014-WSDM2018论文精读:看京东团队如何挖掘商品的替代信息和互补信息【萌萌家】.pdf
- 019-SIGIR2018论文精读:偏差和“流行度”之间的关系【萌萌家】.pdf
- 025-ICML2018论文精读:模型经得起对抗样本的攻击?这或许只是个错觉【萌萌家】.pdf
- 026-ICML2018论文精读:聊一聊机器学习算法的“公平性”问题【萌萌家】.pdf
- 027-ICML2018论文精读:优化目标函数的时候,有可能放大了“不公平”?【萌萌家】.pdf
- 031-经典有哪些信誉好的足球投注网站核心算法:TF-IDF及其变种【萌萌家】.pdf
文档评论(0)