Home
Posts
Tag
About
VGG
VGG
2019-03-27 15:26:32
#Deep Learning
#Image Recognition
Abstract/Instroduction/ConvNet Configuration/训练和评估/对比/总结 # 1.Abstract 介绍模型深度与模型的预测精度之间的关系 - a) VGG是16-19层的一个模型,主要使用3*3filter的卷积 - b) 评估角度:localization,classification tracks - c) 在其他模型的扩展表现优异 # 2.Introduction ConvNet在高清图与视频中的表现优异 - a) 巨量开源图片数据(open large ImageNet)/巨量的GPU/新型Clusters - b) 模型的研究方向从高纬度浅层的features encoding到深层的ConvNet 目前存在的改进(commodity)方向有以下几种: - a) 从filter尺寸下手,寻求更小的filter/寻求更小的stride - b) 训练测试方向改进/mult-scales上着手 - c) 本文:深度角度进行改变 - fix other parameters - increase the depth of the networks by adding more convolutional layes - small (3*3 filter) convolution # 3.ConvNet Configuration - Pre-processing (Routine parameter settings) - 3 FC layer (General structure of model) - rectification(non-linearity) ### 改进 - 2个3 * 3 conv == 1个5 * 5 conv - 3个3 * 3 conv == 1个7 * 7 conv - 前置多层conv导致后层多relu能让分辨能力变得更强 - 降低parameters的数量 - 1 * 1 conv 层新认知 # 4.训练和评估 在AlexNet进化而来,因此与其进行比较: - VGG能更快找到最低loss - 原因1:大深度+小filter - 原因2:初始化处理(猜测?) ### 训练 - 两种获取training scale S方案 - 4GPU,提速3.75倍,整个训练需要2-3周 ### 评估 - top1 error - top5 error - single scale/multi-scale/multi-crop # 5.对比 ILSVRC-2012和ILSVRC-2013竞赛中取得最好的结果 # 6.总结 在此项论文工作中,作者评估了具有异常深度的卷积网络(最多19个权重层)用于大规模图像分类的效果,并证明深度有利于分类精度,展示基于深度方向的研究是一个在视觉中可继续拓展的重要领域。 # [7.Referance](https://dblp.uni-trier.de/search?q=very%20deep%20convolutional%20networks%20for%20large-scale%20image%20recognition) # 8.拓展 在实际的项目落地过程中,目前过多层的深度神经都不太现实,虽然实验室跑起来不错,但是实际拿到应用场景中来,效果估计会不咋地。因此如果以应用为目标展开工作,基于VGG这种20-的网络就不错。