深度学习介绍
前言
深度学习作为机器学习的一个前沿领域,正推动着从图像识别到自然语言处理等多个行业的变革。与传统机器学习相比,深度学习无需手动设计复杂的特征提取步骤,而是通过多层神经网络自动从大量数据中学习高级特征。
备注:本系列文章基于B站课程: 122集付费!CNN、RNN、GAN、GNN、DQN、Transformer、LSTM等八大深度学习神经网络一口气全部学完!学习整理得到。
1、深度学习和机器学习的区别
1.1 特征提取方面
机器学习的特征工程步骤是要靠手动完成的,而且需要大量领域专业知识;
深度学习通常由多个层组成,它们通常将更简单的模型组合在一起,通过将数据从一层传递到另一层构建更复杂的模型。通过大量数据的训练自动得到模型,不需要人工设计特征提取环节。
深度学习算法试图从数据中学习高级功能,这是深度学习的一个非常独特的部分。因此,减少了为每个问题开发新特征提取器的任务。适合用在难提取特征的图像、语音、自然语言领域。
1.2 深度学习应用场景
- 图像识别
- 物体识别
- 场景识别
- 车型识别
- 人脸检测跟踪
- 人脸关键点定位
- 人脸身份认证
- 自然语言处理技术
- 机器翻译
- 文本识别
- 聊天对话
- 语音技术
- 语音识别
1.3 深度学习代表算法-神经网络
人工神经网络(Artificial Neural Network,简写为 ANN )也简称为神经网络(NN)。是一种模仿生物神经网络(动物的中枢神经系统,特别是大脑)结构和功能的 计算模型。
2、神经网络的结构组成
经典的神经网络结构包含三个层次的神经网络。分别是 输入层、输出层和隐藏层。
其中每层的圆圈代表一个神经元,隐藏层和输出层的神经元由输入的数据计算后输出,输入层的神经元只是输入。
- 神经网络的特点
- 每个连接都有个权值,同一层神经元之间没有连接
- 神经元当中会含有激活函数
- 最后的输出结果对应的层也称之为全连接层
神经网络是深度学习的重要算法,用途在图像(如图像的分类、检测)和自然语言处理(如文本分类、聊天等)
3、深度学习的效果特点
过去十多年,得益于数字社会的发展,积累了大量的数据。以前的一些算法到达了瓶颈期,它们无法适用于大量的数据。“大规模”一直推动深度学习的发展进步。不仅仅是数据量的大,算法模型规模越来越大等。
- 数据
- 计算:训练网络需要 GPU、TPU 等;
- 算法:一些创新,如 ReLU 激活函数;