论文参考文献

首页 » 常识 » 诊断 » 94页论文综述卷积神经网络从基础技术到研
TUhjnbcbe - 2025/7/2 17:01:00

卷积神经网络(CNN)在计算机视觉领域已经取得了前所未有的巨大成功,但我们目前对其效果显著的原因还没有全面的理解。近日,约克大学电气工程与计算机科学系的IsmaHadji和RichardP.Wildes发表了论文《WhatDoWeUnderstandAboutConvolutionalNetworks?》,对卷积网络的技术基础、组成模块、当前现状和研究前景进行了梳理,介绍了我们当前对CNN的理解。机器之心对本论文进行了摘要式的编译,更详细的信息请参阅原论文及其中索引的相关文献。文章选自arXiv,机器之心编译。

论文  动机

过去几年来,计算机视觉研究主要集中在卷积神经网络(常简称为ConvNet或CNN)上。这些工作已经在广泛的分类和回归任务上实现了新的当前最佳表现。相对而言,尽管这些方法的历史可以追溯到多年前,但对这些系统得到出色结果的方式的理论理解还很滞后。事实上,当前计算机视觉领域的很多成果都是将CNN当作黑箱使用,这种做法是有效的,但其有效的原因却非常模糊不清,这严重满足不了科学研究的要求。尤其是这两个可以互补的问题:(1)在被学习的方面(比如卷积核),究竟被学习的是什么?(2)在架构设计方面(比如层的数量、核的数量、池化策略、非线性的选择),为什么某些选择优于另一些选择?这些问题的答案不仅有利于提升我们对CNN的科学理解,而且还能提升它们的实用性。

此外,目前实现CNN的方法需要大量训练数据,而且设计决策对结果表现有很大的影响。更深度的理论理解应该能减轻对数据驱动的设计的依赖。尽管已有实证研究调查了所实现的网络的运行方式,但到目前为止,这些结果很大程度上还局限在内部处理过程的可视化上,目的是为了理解CNN中不同层中发生的情况。

1.2  目标

针对上述情况,本报告将概述研究者提出的最突出的使用多层卷积架构的方法。要重点指出的是,本报告将通过概述不同的方法来讨论典型卷积网络的各种组件,并将介绍它们的设计决策所基于的生物学发现和/或合理的理论基础。此外,本报告还将概述通过可视化和实证研究来理解CNN的不同尝试。本报告的最终目标是阐释CNN架构中涉及的每一个处理层的作用,汇集我们当前对CNN的理解以及说明仍待解决的问题。

1.3报告提纲

本报告的结构如下:本章给出了回顾我们对卷积网络的理解的动机。第2章将描述各种多层网络并给出计算机视觉应用中使用的最成功的架构。第3章将更具体地

1
查看完整版本: 94页论文综述卷积神经网络从基础技术到研