澎思科技获ICCV2019三项竞赛第一 持续深化面向场景的AI技术研发与创新

来源:IT1682019-11-08 14:55:43

10月27日至11月2日,两年一届的国际计算机视觉大会

ICCV2019(InternationalConferenceonComputerVision)在韩国首尔召开。国际计算机视觉大会(ICCV)与计算机视觉模式识别会议(CVPR)、欧洲计算机视觉会议(ECCV)并称计算机视觉方向的三大顶级会议。澎思科技首次参加便一举获得ICCVLFR三项竞赛第一,并获得组委会颁发的特别创意奖,这彰显了澎思在落地应用场景化的计算机视觉技术实力。

无约束条件下的静态图像人脸识别和动态视频人脸识别是计算机视觉领域研究最为深入的课题之一,在视频监控、生物医疗等领域拥有广泛的应用场景。近年来,计算机视觉各领域的新技术、新方法都在多个顶级计算机视觉会议上被提出,基于深度学习的人脸识别技术也取得了阶段性的进展。

尽管在人脸识别领域的研究取得了很多成果,但在基于深度学习的轻量级人脸识别研究和努力仍有待加强。在面对大数据库人脸识别应用的背景下,寻找一个可以在无限制的动态监控视频场景下有优异的表现的轻量级高精度的模型依然是一个挑战。

ICCVLFR(LightweightFaceRecognitionChallenge)轻量级人脸识别挑战赛正是基于这样的目的设立。它也成为今年ICCV的一项重要竞赛,吸引了来自全球292支竞赛队伍的参加。不同于其他人脸识别比赛,ICCVLFR挑战赛严格限制了训练数据和测试数据。在如此严格的限制条件下,如何在292个参赛队伍中脱颖而出变得异常艰难。

ICCVLFR竞赛的训练和测试数据

此次ICCVLFR挑战赛一共分为四项竞赛,每项竞赛都有各自的限制和侧重点:

1、Protocol-1(DeepGlint-Light)图像人脸识别轻量级识别模型,运算复杂度小于1Gflops,模型大小小于20MB,数据类型float32,特征维度512(FPR@1e-8);

2、Protocol-2(DeepGlint-Large)图像人脸识别大型级识别模型,运算复杂度小于30Gflops,数据类型float32,特征维度512(FPR@1e-8);

3、Protocol-3(IQIYI-Light)视频人脸识别轻量级识别模型,运算复杂度小于1Gflops,数据类型float32,特征维度512(FPR@1e-4);

4、Protocol-4(IQIYI-Large)视频人脸识别大型识别模型,运算复杂度小于30Gflops,数据类型float32,特征维度512(FPR@1e-4)。

澎思新加坡研究院团队做OralPresentation

最终,澎思新加坡研究院申省梅团队提出基于关系图的无监督学习方法来强化特征,在ICCVLFR挑战赛的轻量级图像识别、大型图像识别和轻量级视频图像识别三项竞赛中成绩第一,领先微软亚洲研究院、中科院自动化所、京东、今日头条等参赛的研究机构和企业,并与它们拉开了不小的差距。在轻量级图像识别比赛中,误报率在亿分之一(1e-8)的情况下,澎思科技取得了93.41%成绩,比其他参赛者高了近六个百分点。在轻量级视频图像比赛中,澎思科技72.23%的成绩比其他参赛者高了近九个百分点。

ICCVLFR三项竞赛比赛结果

在ICCVLFR的Workshop上,澎思新加坡研究院团队做了题为“AGraphBasedUnsupervisedFeatureClusteringforFaceRecognition”的口头报告,阐述了团队提出的无监督学习方法,利用测试数据两两之间的关系,使得属于同一个ID的特征分布更加紧凑,不同ID的特征之间距离更加分散,由此大幅度提高了识别精度。该方法的有效性在IJB-C,YTF和CFP数据库上都已经被验证,并且大幅度提高了基线模型(baseline)的精度。

基于关系图的无监督学习方法示例流程图

除了在ICCVLFR挑战赛上取得三项第一外,澎思科技最新的算法模型在美国NIST人脸识别公开数据集IJB-C上的表现也打破了世界记录。IJB-C是在无限制条件下的美国NIST人脸识别公开数据集中最为科学全面的基准数据库。在LFW,CFP-FP,AgeDB-30精确度普遍饱和的今天,IJB-C是目前最贴近视频监控实战应用场景的人脸识别基准数据库。

澎思科技在NISTIJB-C数据集上的测试结果

不仅仅是人脸识别领域,澎思科技近期在行人再识别(ReID)、视频行人再识别(Video-basedReID)、即时定位与地图构建(SLAM)等计算机视觉技术上均取得突破,获得多项世界冠军。

-7月,澎思科技在行人再识别(ReID)三大主流数据集测试Market1501,DukeMTMC-reID,CUHK03上刷新世界纪录。

-8月,澎思科技刷新视频行人再识别(Video-basedReID)三大数据集PRID-2011,iLIDS-VID,MARS历史最好成绩。

-10月,在刚刚结束的ISMAR2019上,澎思科技在AR-SLAM挑战赛中获得VSLAM竞赛第三名。SLAM技术可以用于各种应用包括自动驾驶,运动机器人,3D重建,增强现实和混合现实。视觉SLAM是澎思科技在计算机视觉技术上的一个重要积累,也将为公司在现有和将来的业务中附加更多价值。正在举行的2019深圳安博会上,澎思科技推出了面向安防场景的无人巡逻警车,后续澎思自研的深度学习VisualSLAM技术就将逐步替代3DLiDAR来完成无人巡逻车的定位导航,从而降低成本,扩展应用场景。

目前,澎思科技在北京和新加坡两地设立研究院,不断汇聚全球AI人才,拥有全自研、全栈的计算机视觉技术,横跨计算机视觉多个研究领域。在此基础之上,澎思科技一方面立足于现有业务和商业模式,结合公司的发展方向展开面向场景的AI技术研发和创新;另一方面不断从全球视角探索前沿技术,让公司始终保持对突破性科技的敏感度和关注度,为公司发力人工智能领域、探索新业务做好技术储备。

责任编辑:詹哲

标签: AI 澎思科技

相关文章

要闻

原创

最新

取消