1.1 深度学习的基础理论

深度学习(DL)是机器学习(ML)家族的一部分,是基于对人工神经网络的研究。深度学习中的“深度”是指神经网络中包含很多层。随着网络越来越深,学习效果也不断改善。每一层网络都以特定的方式处理输入数据,然后将输出数据传送至下一层。这样,上一层的输出就变成下一层的输入。

训练深度学习网络很耗时,而且需要大量的数据。神经网络起源于 20世纪 50年代,但直至近些年随着算力和存储能力的提升,深度学习算法才逐渐应用于一些很实用的新技术,包括语音识别、机器视觉和医学图像分析等。本节介绍深度学习的基础理论。