【3分钟学技术】人工智能如何用“眼睛”分辨鸟和猫?

本文字数1870字,阅读时间预计3分钟,加入华为认证圈子,获取最新华为职业技术认证新资讯,学习华为公开课,专家专栏带你了解ICT(信息通信技术)行业关键技术。

文末“了解更多”免费获得华为零基础入门AI(人工智能)课程。


作者:华为人工智能高级讲师 王豪聪

华为人工智能专业建设首席架构师 张志峰

随着计算机技术的不断发展,网络上的图像数据越来越多。根据GIV组织的预测,到2025年,所有网络数据中89%是图片(视频)数据。因此,图像处理技术变得越来越重要。在众多图像处理算法中,卷积神经网络是最重要的一种,被大量应用于计算机视觉、自然语言处理等人工智能领域 。

什么是卷积神经网络?

听到“卷积”、“神经网络”,你脑海中也许会浮现下面的场景:

【3分钟学技术】人工智能如何用“眼睛”分辨鸟和猫?

是的,这是卷积核在计算机中运算时的样子,但我们将用另一种直白易懂的方式来理解这个过程。

你可以想象这样一个场景:有一只猫和一只鸟,你将如何区别它们呢?

面对这个问题,你的第一反应是什么?“鸟有翅膀”、“猫有四条腿”、“它们的尾巴不同”、“鸟的嘴是尖的,猫不是”等等。实际上,这是对我们人类认知系统最简单的一次测试。从中我们可以发现,任何一个物体都是以一个个最简单的特征存储在我们的认知系统中。需要对事物进行判断时,认知系统会首先给出一个最简单的区别特征,这也是认知系统的工作方式——化繁为简:以每个特征为最小单位进行区别,从局部到全局进行特征提取并匹配,最终得出一个认知结果。

【3分钟学技术】人工智能如何用“眼睛”分辨鸟和猫?

通过卷积核寻找特征

上面这张图就是一个简单的卷积神经网络的架构图。我们可以将一个个卷积核理解为一个个特征,图中K1,K2……Kn代表不同的卷积核也就是不同特征。回到刚才的场景中,假设这个神经网络实现的功能就是对鸟和猫进行区分。那么卷积核K1可能代表 “翅膀”,卷积核K2可能代表“嘴巴”,卷积核Kn可能代表“爪子”,当一张图片进入到这个认知系统,一个个卷积核会去处理这个图片,寻找其代表的特征。从图片的左上角一步步,一行行移动并匹配特征,寻找图片中与目标特征相似的位置,输出一张特征图片,图片中的每个点都代表图中每个区域是否有我们要找的那个特征。如下面这张图,这是一张卷积后的特征图,图中每个点代表原区域与特征的相似程度,数值越高,相似程度越高。

【3分钟学技术】人工智能如何用“眼睛”分辨鸟和猫?

池化层加工提炼

卷积层之后通常会跟一层池化层,并进行下图的操作。

【3分钟学技术】人工智能如何用“眼睛”分辨鸟和猫?

从图中可以看出,经过池化层,我们仅保留各自池化区域中数值最大的部分,将4X4的图片缩小成2X2的图片。在卷积神经网络中,池化层也是非常重要的。试想一下,如果卷积后的结果代表着与特征的相似程度,而我们认知、分类的关键就是特征,那么我们只要找到最具特征的部分进行处理,筛选出重要部分即可。同时,通过池化层缩小尺寸后,也减少了神经网络的计算量。

池化层还有一个关键作用就是扩大了卷积核的作用范围。试想一下,当对上图2X2的特征图再次进行卷积时,就相当于对原4X4的图片进行了卷积,这使得在多次池化后,我们要寻找的特征可能不是“局部”细节特征而是“全局”的风格特征或轮廓特征,这也给我们的神经网络提供了更强的稳定性。

经过以上两步,一张图片的主要特征已经被我们提取出来了。现在认知系统知道这个图片中“有翅膀”、“有爪子”、“有尖尖的嘴巴”。那么下一步如何根据这些结果分析出这张图是属于鸟还是猫呢?

全连接层进行分类

这时,全连接层的作用就显现了——分类!

【3分钟学技术】人工智能如何用“眼睛”分辨鸟和猫?

如果我们将具备一种特征标记为1,不具备该特征标记为0,如上图所示。那么猫的类别就是0101,鸟的类别就是1110。这就是全连接层的作用:将我们提取出的特征进行汇总分类,来完成整个认知系统的最后一步。

当然,一个真正的卷积神经网络要比我们假设的场景要复杂得多,每一个卷积层和池化层都包含了大量的神经元结构,我们也会应用更多种类的卷积核和其他正则化方法来提高网络的能力。

如今,全世界的学者也提出了很多经典的卷积神经网络模型,如:Resnet,VGG16,inception V3等。但神经网络最核心的特点还是以卷积核为基础,分解输入数据为一个个特征,从而由局部至整体对数据进行分析。也正是卷积神经网络的这个优点,使得它在图像领域取得了非常瞩目的成就。同时,卷积神经网络对旋转、缩放、位移的鲁棒性使得它对数据特征的分析、处理得非常准确,使其应用也已经开始向其他领域拓展,如:字符识别、语音识别等。

看完利用卷积神经网络对猫和鸟进行分类,是不是觉得能秒懂高大上的人工智能技术?在华为AI认证的课程中,我们将深入浅出地讲解包括卷积神经网络在内的有关人工智能的各方面的知识,让你学到人工智能的扎实理论并应用到实践中。


【3分钟学技术】人工智能如何用“眼睛”分辨鸟和猫?


分享到:


相關文章: