博雯 发自 凹非寺
量子位 报道 | 公众号 QbitAI
ICCV 最佳论文刚刚公布:
中国学者凭借Swin Transformer获此殊荣。
这一研究由微软亚研院(MSRA)提出,论文的四位共同一作分别是来自中国科学技术大学的刘泽、西安交通大学的林宇桐、以及MSRA的曹越和胡瀚。
而根据本届会议汇总,45.7%的接收论文来自中国,这个数量是第二位美国地区(23.6%)的近2倍。
这届会议中的最佳论文到底做了哪些贡献,除此之外还颁布了哪些奖项,接收的论文又呈现出怎样的趋势?
我们一一来看。
最佳论文是MSRA成果
获最佳论文的Swin Transformer今年3月由微软研究院提出,是一种基于Transformer的视觉骨干网络。
这一网络基于分层特征图,利用特征金字塔网络(FPN)或U-Net等技术进行密集预测,同时将自注意力计算限制在不重叠的局部窗口中,同时允许跨窗口连接,从而带来更高的效率。
最终,Swin Transformer在分类、检测、分割等各大CV任务中跨领域超车,一举达到了SOTA。
华人学者再中荣誉提名论文
除了最佳论文外,最佳学生论文等奖项同样受人瞩目。
最佳学生论文奖由四位来自苏黎世联邦理工学院(ETH Zurich)的学者获得,他们提出了一种框架,能够大幅度提升SFM建模精度与后续的视觉定位精度。
荣誉提名论文共有4篇,其中第三篇OpenGAN的论文一作是来自卡内基梅隆大学的华人学者Shu Kong。
Common Objects in 3D: Large-Scale Learning and Evaluation of Real-Life 3D Category Reconstruction
Viewing Graph Solvability via Cycle Consistency
OpenGAN: Open-Set Recognition via Open Data Generation
Mip-NeRF: A Multiscale Representation for Anti-Aliasing Neural Radiance Fields
论文类奖项之后,再来看过往杰出研究类奖项(PAMI-TC):
Azriel Rosenfeld终身成就奖,用于奖励在长期职业生涯中为计算机视觉领域作出突出贡献的杰出研究者,由加州大学伯克利分校的电气工程和计算机科学教授RUzena Bajcsy获得。
杰出学者奖项,由加州理工学院的教授Pietro Perona,以及法国国家信息与自动化研究所(INRIA)研究员Cordelia Schmid获得:
ICCV Helmholtz奖项,主要之后针对那些对计算机视觉研究有重大意义的十年前的论文,由以下三篇论文获得:
ICCV Everingham奖则用于奖励为计算机视觉社区作出无私而重要贡献的研究个人或团队,由KITTI 视觉基准团队和Detectron对象检测和分割软件团队获得。
接收率26%,姿态检测“最容易中”
本届会议为期三天。据统计,ICCV 今年共接收有效稿件6152篇,比去年增加了1800篇。
其中共有1612篇被收录,接收率为26%,其中210篇论文为oral。
会议上也统计了主会场的接收论文的分布领域,可以看到迁移\小样本\无监督学习领域的论文最多,超过了100篇:
在所有论文中,姿态检测、机器和自动驾驶视觉、视频分析和理解等领域的论文的被接收率都较高,而与脸部相关的论文被拒率则最高。
ICCV官网:
/home
全论文整理:
/amusi/ICCV-Papers-with-Code
本文仅做学术分享,如有侵权,请联系删文。
3D视觉精品课程推荐:
1.面向自动驾驶领域的多传感器数据融合技术
2.面向自动驾驶领域的3D点云目标检测全栈学习路线!(单模态+多模态/数据+代码)
3.彻底搞透视觉三维重建:原理剖析、代码讲解、及优化改进
4.国内首个面向工业级实战的点云处理课程
5.激光-视觉-IMU-GPS融合SLAM算法梳理和代码讲解
6.彻底搞懂视觉-惯性SLAM:基于VINS-Fusion正式开课啦
7.彻底搞懂基于LOAM框架的3D激光SLAM: 源码剖析到算法优化
8.彻底剖析室内、室外激光SLAM关键算法原理、代码和实战(cartographer+LOAM +LIO-SAM)
重磅!3DCVer-学术论文写作投稿交流群已成立
扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。
同时也可申请加入我们的细分方向交流群,目前主要有3D视觉、CV&深度学习、SLAM、三维重建、点云后处理、自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。
一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉+ 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。
▲长按加微信群或投稿
▲长按关注公众号
3D视觉从入门到精通知识星球:针对3D视觉领域的视频课程(三维重建系列三维点云系列结构光系列、手眼标定、相机标定、激光/视觉SLAM、自动驾驶等)、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近4000星球成员为创造更好的AI世界共同进步,知识星球入口:
学习3D视觉核心技术,扫描查看介绍,3天内无条件退款
圈里有高质量教程资料、答疑解惑、助你高效解决问题
觉得有用,麻烦给个赞和在看~