卷积神经网络CNN的基本结构

卷积神经网络在AI领域中一种常见的工具,特别是在图像识别、处理中很常见。与传统的神经网络不同,它的每个神经元可以看作包括了卷积、阈值、池化三个步骤。卷积操作用于特征识别,阈值操作通常是ReLU函数用于特征的提取,池化层相当于数据的压缩。

卷积相当于一个特征识别的过程,每一个特征就是一个卷积核,比如我要找眉毛就用眉毛和图片做卷积如果,找鼻子就用鼻子和图片做卷积,就是先乘后加再除的一串操作。


卷积神经网络CNN的基本结构

左上角就是卷积核,代表的某种特征,中间的就是需要识别的图像,右上角就是卷积的结果,如果找到了特征那么算下来的结果值是最大的,所以在卷积后图像中找到最大值的位置就找到了特征。当然这个最大值往往是由某个阈值来控制的,这就用到了ReLU函数,超过的阈值的数会被保留下来,这样图像就变成了一副准特征图了。


卷积神经网络CNN的基本结构

当然这个函数不是一个阶梯函数,需要一个连续函数才能在神经网络中训练,所以一般选择ReLU函数。经过阈值处理以后,图像中包含了很多没用的0,所以这时候可以将没有用的信息去掉,使得图像只保留特征的信息便于以后进行处理,这个步骤就是池化pooling。


卷积神经网络CNN的基本结构

用一个最大2*2矩阵扫描图像,取每个区域某个特征,如选区区域中的最大值就是max_pooling,如上图。经过池化操作,图像就被压缩了保留了那些你需要的信息。

CNN本质上是神经网络,通过每一层的数据处理对象的特征被提取出来了,然后进入下一层进行进一步的提取直到得到结果。神经网络的基本结构就包括这几个基本要素,在其上还有许多的变化,但是万变不离都离不开他的基本结构。


卷积神经网络CNN的基本结构


分享到:


相關文章: