一、神经网络简介
(一)神经元的工作原理
从百度百科上解释是:神经元即神经细胞,是神经系统最基本的结构和功能单位,分为细胞体和突起两部分,细胞体由细胞核、细胞膜、细胞质组成,具有联络和整合输入信息并传出信息的作用。突起有树突和轴突两种,树突短而分枝多,直接由细胞体扩张突出,形成树枝状,其作用是接受其他神经元轴突传来的冲动并传给细胞体;轴突长而分枝少,为粗细均匀的细长突起,常起于轴丘,其作用是接受外来刺激,再由细胞体传出。轴突除分出侧枝外,其末端形成树枝样的神经末梢。末梢分布于某些组织器官内,形成各种神经末梢装置,感觉神经末梢形成各种感受器;运动神经末梢分布于骨骼肌肉,形成运动终极。
简单来说就是信号从树突一端沿着轴突再传到树突,这样就从一个神经元传到另一个神经元。
(二)神经网络的工作机制
从百度百科上解释是:生物神经网络一般指生物的大脑神经元,细胞,触点等组成的网络,用于产生生物的意识,帮助生物进行思考和行动。人工神经网络(Artificial Neural Networks,简写为ANNs)也简称为神经网络(NNs)或称作连接模型(Connection Model),它是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。
简而言之是生物神经元可以接受许多输入,而不仅仅是一个输入,树突收集了这些电信号, 将其组合形成更强的电信号。如果信号足够强, 超过阈值,神经元就会发射信号, 沿着轴突,到达终端,将信号传递给下一个神经元的树突。
二、神经网络模型的输入输出值
神经网络模型的输入值是MNIST数据集,这个数据集是纽约大学YannLeCun教授开发,从MNIST数据集官网(http://yann.lecun.com/exdb/MNIST/,见图3 MNIST数据集官网截图信息)上明确信息如下:
1、数据集包含四个文件:训练集图片、训练集标签、测试集图片、测试集标签;
2、训练集来自 250 个不同人手写的数字构成, 其中 50% 是高中学生, 50% 来自人口普查的工作人员. 测试集也是同样比例的手写数字数据;
3、训练集中包含6万张图片,测试集中包含1万张图片;
4、每个图片都是28*28像素大小的灰度图像,每个像素0~255。
每个 MNIST 图像是一个单一的手写的数字字符的数字化的图片(见图4 MNIST手写数字样本数据集)。每个图像是 28 x 28 像素大小,共计784个像素点,每个像素值是 0表示白色,255表示黑,范围0-255,中间像素值表示的灰度级。
首先打开其中一个MNIST数据集文件,第一个字符代表所显示的数字,后面的784个值代表的是第一个字符所显示数字的灰度值(见图5 记事本打开的MNIST数据集文件样例)。
然后从图片的角度展示输入值MNIST数据(见图6 展示MNIST数据集灰度值),每个图像是 28 x 28 像素大小,共计784个像素点,每个像素值是 0表示白色,255表示黑,范围0-255,中间像素值表示的灰度级,此784个像素点就是此神经网络模型的输入内容。
但是这个输入值的数字范围是从0-255,为了避免输入信号过大,导致过饱和,所以需要对每一个像素做归一化处理,最简单的归一化处理就是给每一个像素都除以255,把像素变成0.01-1之间的数字。所以本次神经网络模型的输入值是784个0.01-1之间的数字(见图7 神经网络模型中灰度值归一化处理后的输入值),同时输出值是经过算法模型判别后输出的0-9的10个数字。
三、构建模型
- 构建神经网络模型过程
- 通过数学思想模拟构建神经网络的工作机制
1、模拟构建神经元的工作机制
从神经元的工作原理来看,若是用数学思想来模拟的话,可以这样理解生物的神经元输入电信号后再输出另一个电信号。不过生物神经元与简单的线性函数不一样,不能简单的对输入做出反应。在产生输出之前,输入必须达到一个阈值,只有在输入明显的信号时才能有输出。
从上述的数学思想模拟构建神经元的工作机制中可以显示为,当输入达到阈值时,输出才有反映ÿ