主页 > IT资讯 > 正文

百度飞桨强助攻 视觉技能再攀顶峰摘得CVPR 10大冠军

计算机视觉界的“奥斯卡”,一年一度的CVPR刚刚落下帷幕,百度大脑以CVPR 中10项比赛的夺冠向世界显示了其不容小觑的技能实力,令人振奋。6月16-20日,计算机视觉及模式辨认范畴尖端世界学术会议CVPR在美国加州长滩举行,逾越9200位相关人士共赴盛会。本届会议收到了5160篇提交论文,其间1294论文终究被接纳宣布,其间百度共有17篇论文被录入。

百度相关视觉团队赴美参会,共举行两项Workshop、一项Tutorial讲座,并接连取得10项CVPR比赛使命的冠军,全面包括视觉范畴下的视频了解与剖析、方针检测、图画超分辩、智能城市车辆辨认、人脸&人体检测等很多抢手子范畴。其间,百度研讨院团队获4项冠军、百度视觉团队获6项冠军,此前被CVPR大会录入的论文也大多出自这两个团队。


视频了解&剖析范畴

ActivityNet是现在视频了解范畴影响力最大的赛事,与每年的尖端学术会议CVPR一同举行本次比赛中,百度更是取得视频动作提名、视频动作检测两项使命的冠军,并在新增使命EPIC-Kitchens动作辨认应战赛中获两项测验集冠军(Seen kitchens和Unseen kitchens)。这已是百度视觉团队接连三年在ActivityNet相关赛事中斩获冠军。

视频了解是计算机视觉和模式辨认范畴的根底问题之一,其间视频动作提名和视频动作检测在安防、视频摘要等场景下具有重要的运用价值。在视频动作提名、视频动作检测两项使命中,百度别离针对动作分类、动作鸿沟不精确等问题提出C-TCN、BMN等模型,在THUMOS和ActivityNet两个揭露数据集的方针均到达世界抢先,相关的代码将于6月底选用飞桨(PaddlePaddle)开源。

本年的新增使命EPIC-Kitchens动作辨认应战赛聚集榜首人称视频了解,对可穿戴设备、智能家居、人机交互等方面的运用起着要害效果,也是现在学术界、工业界重视的焦点。比赛招引了Facebook AI、牛津大学、INRIA(法国国家信息与自动化研讨所)等66支部队参与,百度在该使命中的Seen kitchens和Unseen kitchens 两项测验集上以很大优势取得榜首,并受邀在CVPR 2019 EPIC和ActivityNet Workshop上作出陈述。

针对榜首人称视频小物体多,含糊遮挡严峻等难点,百度运用2D检测结构和3D卷积网络结合的办法进行视频特征提取。不仅如此,百度还提出了门控特征交融模块,经过增强视频片段特征与上下文物体特征之间的非线性交互,使得输出表征具有更好的分辩才能。

人体检测范畴

在人体检测范畴,百度更是“开挂”一般,拿下“三连冠”。在“Look Into Person”世界比赛(以下简称LIP)三项人体精密化解析比赛单元(Track1:Single-Person Human Parsing,Track3:Mult-Person Human Parsing,Track4:Video Multi-Person Parsing)中,百度均获榜首名。LIP世界比赛专心于人体的精密语义了解使命,包括单人的人体解析使命、单人的人体姿势估量使命、多人的人体解析使命、视频多人人体解析使命。此次比赛的主题为杂乱场景中人体的视觉了解,是计算机视觉范畴的基本问题之一,对视频监控、人机交互、自动驾驶、虚拟现实等场景具有重要意义。

1.png

2.png

3.png

(获奖证书)

 

比赛中,单人人体解析比赛单元的使命是输出单人图片语义切割信息(如上肢和下肢等)。针对人体要害方针区域较小、难以检测的问题,百度对以往依据多标准全卷积神经网络的模型(例如Pyramid Scene Parsing Network, DeepLab v3+等)进行改善,使每个卷积核能对图片的细节进行感知,一起输出精度更高的feature map。此外,百度还进行了图片增强、数据扩张,在练习中动态调整输入图片标准,运用mIOU loss丢失函数等,使得模型能够更精确地捕捉肢体的细节、以及被隐瞒的部分。终究依据各个不同模型的效果进行交融,百度取得65.18%的mIoU,取得了单人人体解析的冠军,逾越上届冠军7.2个百分点。

4.png

(单人人体解析成果展现)

多人人体解析和视频人体解析方面,处理的是对图片中以及视频中的多人语义信息切割问题。该比赛数据集与单人人体解析使命比较,更重视多人遮挡等难题,进一步添加比赛难度。在比赛中,百度针对多人遮挡严峻、姿势和视角多样性等特色,优化改善了结合多人检测和单人人体解析的top-down结构,经过终究改善的模型在多人人体解析和视频多人人体解析比赛单元中均取得榜首的成果,成果大幅抢先第二名。

人脸活体检测范畴

人脸活体检测是视觉人脸辨认范畴的一个经典问题。近年来跟着人脸技能的不断落地,活体检测在人脸解锁、人脸付出、长途身份核验等运用上发挥着越来越重要的效果。在CVPR人脸活体检测比赛上,百度作为invited participant在300多个部队中取得榜首的好成果(Acer即均匀错误率最低)。CVPR-19-Face Anti-spoofing Attack Detection ChallengeCVPR会议历史上初次举行人脸活体检测比赛,发布了现在世界上最大的跨模态人脸活体检测数据集CASIA-SURF,包括1000人次的21000段三模态(RGBIRDepth)人脸视频。比赛使命统筹学术和实用价值,非常赋有应战。

作为该项比赛的冠军,百度在活体检测方向已堆集百万级的进犯图画数据,持续研制迭代了多模态(DepthIRRGB)、双端(云端、嵌入式)的活体检测模型。这些模型对内支撑多项中心事务,对外服务很多标杆客户,满意不同的场景运用需求。

方针检测范畴

方针检测是计算机视觉和模式辨认范畴的根底问题之一,百度在该范畴取得"Objects365 物体检测"世界比赛Full Track冠军,而Full Track首要用于探究方针检测体系的功用上限。Objects365作为一个全新的数据集,旨在促进对天然场景不同方针的检测研讨。

Objects365在638K张图画上标示了365个方针类,练习会集共有逾越1000万个鸿沟框。因而,这些标示包括了发生在各种场景类别中的常见方针。参赛者能够运用发布的60万张图片组成的练习集练习一个方针检测模型,对图片中的存在于Objects365界说的365个类中的方针输出围住框,类别和分数。在3万张图片组成的验证集上做算法功用验证,终究在由10万张图片组成的测验会集完结应战。据悉,百度选用了依据飞桨研制的检测练习结构,练习结构及模型行将开源。

一起,百度在NTIRE比赛中的图画超分辩项目也强势夺冠。这是百度初次参与NTIRE(计算机视觉low-level vision范畴中影响力最大的比赛),便在400余支参赛部队锋芒毕露。本次比赛选用了全新拍照的实在数据集(RealSR),百度视觉团队在PSNR和SSIM两项方针上均名列榜首,一起提出极具立异性的CDSR超分模型,经过级联的办法逐渐将图画从含糊变明晰。相关技能选用飞桨布置于百度App,现已运用于Feed图片检查的功用。

5.png

智能城市车辆辨认范畴

本届AI-city揭露赛包括城市规划多摄像头车辆盯梢、城市规划多摄像头车辆重辨认和交通反常检测三个子使命。百度在城市规划多摄像头车辆重辨认使命中取得冠军,得益于飞桨(PaddlePaddle)结构助力,并凭仗在车辆垂类范畴检测、盯梢、特点剖析、要害点定位等技能才能的长时间堆集,完成mAP Score方针到达0.855,逾越第二名6.4个点。

城市规划多摄像头车辆重辨认是智能车辆剖析才能的中心根底技能之一。智能车辆剖析才能为百度在智能城市范畴积极探究供给强有力的支撑,尤其是在城市安防、智能交通等重要的AI2B场景下都离不开对车辆结构化剖析的需求。现在,百度现已敞开车辆检测、车辆特点/车型辨认、车流计算和智能定损等多项相关服务。未来,百度将持续推动车辆垂类技能才能的建造及智能车辆剖析技能迭代,为不同范畴赋能。

百度在本年的CVPR上满载而回,显示出百度大脑在视觉范畴各个方向的长时间堆集、全面发力,更是百度大脑技能实力全球抢先的强壮佐证。不仅如此,作为百度AI技能的集大成者,百度大脑还在对外不断敞开这些顶尖AI技能,现在已对外敞开视觉、语音、天然言语处理等170多项抢先的AI才能,为广阔开发者供给AI技能研制支撑,赋能各行业。

福利放送时间:飞桨亿元免费算力支撑方案进行中,扫码请求Tesla V100在线算力,让模型跑到飞起!

6.png


上一篇:飞桨上线全能转化小东西,教你玩转TensorFlow、Caffe等模型搬迁
下一篇:下一个十年需求的五大IT技能

PythonTab微信大众号:

7.png

Python技能交流合作群 ( 请勿加多个群 ):

群1: 87464755

群2: 333646237

群3: 318130924

群4: 385100854