读研随笔#1: 2020上半年文献阅读汇总/项目关注汇总/人工智能发展现状观察

大家好,我是雷少。距离上一篇个人推送已过去半年,这半年间发生了许多事,我们也因为疫情不能很好地开展交流工作。但是无法见面不代表工作不能完成,这几个月来我也在思考呈现自己工作内容的一些形式,不能因为宅在家就放弃了学习。“读研随笔”系列会是长期做下去的一个系列,目前规划为至少到研究生毕业,不定期更新。由于我的研究方向与人工智能相关,因此更多地会讨论这方面的学术课题,也期待着能与更多学术同行交流。祝大家阅读愉快!
一、文献
2020年上半年我几乎是在家度过的。这段时间我除了完成本校的毕业设计,也广泛涉猎了人工智能领域的多个方向。接下来我将我这半年来(有些是2019年读的)阅读过的人工智能主流文献按照研究方向逐一罗列,每篇文献会标注类型、被引量与我的推荐指数,大家可以通过文末的“阅读原文”(提取码:kasb)获取所有文献的pdf版本,也可以在公众号后台回复“论文”获取相关资料。
【图像分类】
(1)(图像分类大赛2012最佳)ImageNet Classification with Deep Convolutional Neural Networks(被引量:66721)推荐指数:★★★★★
(2)(CVPR2014)Going Deeper with Convolutions(被引量:23060)推荐指数:★★★★☆
(3)(ICLR2015)Very Deep Convolutional Networks for Large-Scale Image Recognition(被引量:41894)推荐指数:★★★★★
(4)(Inception-v2)Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift(被引量:19760)推荐指数:★★★☆☆
(5)(CVPR2015)Rethinking the Inception Architecture for Computer Vision(被引量:8896)推荐指数:★★★★☆
(6)(CVPR2016)Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning(被引量:5084)推荐指数:★★★★☆
(7)(CVPR2016)Deep Residual Learning for Image Recognition(被引量:51718)推荐指数:★★★★★
【目标检测】
(1)(CVPR2014)Rich feature hierarchies for accurate object detection and semantic segmentation(被引量:13702)推荐指数:★★★★☆
(2)(ICCV2015)Fast R-CNN(被引量:10482)推荐指数:★★★☆☆
(3)(CVPR2016)Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks(被引量:20308)推荐指数:★★★★★
(4)(CVPR2017)Feature Pyramid Networks for Object Detection(被引量:4105)推荐指数:★★★★★
(5)(CVPR2017)Mask R-CNN(被引量:7147)推荐指数:★★★★☆
(6)(CVPR2015)You Only Look Once: Unified, Real-Time Object Detection(被引量:10222)推荐指数:★★★★★
(7)(CVPR2016)SSD: Single Shot MultiBox Detector(被引量:9510)推荐指数:★★★★★
(8)(CVPR2018)YOLOv3: An Incremental Improvement(被引量:3363)推荐指数:★★★★★
(9)(CVPR2017)Focal Loss for Dense Object Detection(被引量:3812)推荐指数:★★★★☆
【超分辨率】
(1)(综述)Deep Learning for Image Super-resolution: A Survey推荐指数:★★★★☆
(2)(CVPR2014)Image Super-Resolution Using Deep Convolutional Networks(被引量:3342)推荐指数:★★★★★
(3)(CVPR2016)Accelerating the Super-Resolution Convolutional Neural Network(被引量:1001)推荐指数:★★★☆☆
(4)(CVPR2016)Real-Time Single Image and Video Super-Resolution Using an Efficient Sub-Pixel Convolutional Neural Network(被引量:1693)推荐指数:★★★★☆
(5)(CVPR2016)Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network(被引量:3898)推荐指数:★★★★☆
(6)(ICCV2017)Image Super-Resolution Using Dense Skip Connections(被引量:396)推荐指数:★★★★☆
(7)(CVPR2017)Enhanced Deep Residual Networks for Single Image Super-Resolution(被引量:1303)推荐指数:★★★★☆
(8)(CVPR2018)A Fully Progressive Approach to Single-Image Super-Resolution(被引量:85)推荐指数:★★★☆☆
二、项目
俗话说:光说不练假把式。只有将论文中的代码应用到实践,才能真正提高自己的工程能力。基于这样的原因我也利用自己的设备完成了一些程序的调试与修改,由于有的项目发布时间较早,运行会比较慢,同时即使是同一个项目也存在版本更新的情况,因此我只挑选了部分项目的部分版本进行实践。人工智能领域非常友好的一点是,几乎所有的项目代码都可以从GitHub上下载运行。以下我罗列了过去半年自己运行过的一些项目,同时也给出了自己的推荐指数,给大家参考。
1.Faster-RCNN: https://github.com/jwyang/faster-rcnn.pytorch 推荐指数:★★★★★
2.YOLOv3: https://github.com/pjreddie/darknet 推荐指数:★★★★★
3.SSD: https://github.com/amdegroot/ssd.pytorch 推荐指数:★★★★☆
4.Waifu2x: https://github.com/nagadomi/waifu2x 推荐指数:★★★☆☆
5.SRGAN: https://github.com/leftthomas/SRGAN 推荐指数:★★★★☆
三、对人工智能发展现状的观察
作为一个入坑人工智能两年的“小白”,说句实话,我对这一领域的了解还是非常肤浅片面的,但这并不影响我去写一写关于这个行业的认识。
学术方面,最直接的体现是论文的发表情况。下图是一份CVPR历年投稿与接收论文的趋势图,可以看到,近两年来依旧有越来越多的新人涌进这个方向,虽然近几年论文的接收数量出现了比较大的提升,但持续走低的接收率造成了这一行业竞争压力非常大。CVPR只是一个缩影,相信还有更多人在其他期刊上“反复横跳”。我们不可否认学术方面存在一定的内卷现象,但这也不是要我们劝退人工智能的理由。至少在现阶段的论文领域,还是有相当多高质高量的大佬在奋战,这其中不乏何恺明、周志华等大神。相信在可以预见的未来中,通过对这些大佬的架构进行场景适配依旧会是一个比较高效的收割论文的方式。
CVPR历年投稿接收情况[1]
除了算法的更新迭代,我还关注到近些年来同一领域的数据集呈现快速增长的趋势。早期的数据集主要服务于竞赛,而现在数据集更多是一种维护与补充,不管是数量还是大小都远超早期版本。这给新诞生的算法的结果验证带来了更多的挑战,同时更大的数据量让单枪匹马做科研变得很不现实,团队协同还是硬道理。
最后一点我想谈一谈风口。人工智能,至少在我比较熟悉的视觉领域,有些方向几乎已经被前人做到了极限,这种方向如果再继续研究下去很难有所创新。最典型的是图像分类,目前机器学习的能力已经超越了人工分类,而且工业应用也是相对成熟,还在这个方向上做的无非是更多的验证与性能的微弱提升。我认为读研拿这个作为毕业论文意义不大。目标检测,作为最早火起来的一批人工智能方向,这个领域的竞争是非常激烈的。目标检测有相当多的应用场景,商业价值大,甚至只要做视觉就很难脱开目标检测,比如自动驾驶。目前的算法已经可以做到实时物体检测,在识别准确率上依旧有较大的提升空间。我认为目标检测不宜夸大宣传,需要踏实改进参数,因为单个算法的应用场景还是太有限了。其他的,往大的说,比如超分辨率问题,3D点云问题,我很看好更多数据和新想法的加入,因为当下的模型已经过于魔幻,限于个人认知,我无法想象这个趋势发展下去学术界会变成什么样,用性能换普适性到底值不值;往小的说,边缘计算,小样本学习,轻量化学习,工业界已经做出表率,某著名GPU厂的边缘计算设备我很喜欢,做过一些很有意思的项目,但是目前模型的移植是一个大问题,造成这个问题的原因是大部分程序猿对基本算法缺乏理解,不会造轮子,全员调参。总之,人工智能业界需要多交流,一个人的战斗是不符合实际的,容易陷入局部最优(笑),同时夯实算法基础,不然连竞争的资本都没有。
目标检测在自动驾驶中的应用[2]
用一件我印象最深刻的事情作为结束吧。在2018年前后国家层面曾经把人工智能放在一个优先度很高的位置上,当时大量的资本涌入人工智能的研发中。现在两年过去了,人工智能的热潮已经渐渐退去,但讨论度并没有降低。我的理解是人们不再对人工智能抱有不切实际的幻想,而是把注意力放在一些接地气的项目上。这是一个好现象,但对学术圈未必。如果资本总是这么“短视”,恐怕我们还是很难跳出这个领域内卷的事实。我期待着能迎来一个类似四五年前人工智能圈百花齐放的时代,我也惶恐着这样一个时代的到来。毕竟,最好的时代,也是最坏的时代。
图片来源:
[1]https://awesomeopensource.com/project/hoya012/CVPR-2019-Paper-StatisticscategoryPage=2
[2]https://gfycat.com/discover/object-detection-gifs
你“在看”我吗?

版权声明