人工神经网络导论——计算机视觉讲述


人工神经网络导论——计算机视觉讲述

这张照片是什么?

当场景中的内容到达您的眼睛时,您的大脑会立即识别出一堆东西:几只鹿,一辆汽车,茂密的灌木丛和草还有背后的大树干。草和灌木丛是相似的颜色,但不是一回事。您的大脑甚至可能使您感觉到灌木丛上的花朵闻起来像什么。

显然,您的大脑正在执行一系列重要的处理,依靠内置的机制和视觉信息为您提供丰富的场景体验。电脑没有这样的东西,但这是AI研究人员填补空白的伟大项目之一。

本文中,我们将详细研究计算机视觉

处于长达6亿年的动物视觉进化的制胜法宝上,我们大多数人不理解使计算机能够“看到”的困难之处。甚至看不到计算机能看到什么。

我们必须习惯的事情之一是计算机只能以数字思考。无论是文字、照片,歌曲还是视频,它们都由数字列表表示。

当光线进入计算机的摄像头时,它会击中像素并在整个场景中测量光强度。保存在内存中,图片中的场景看起来像这样:

人工神经网络导论——计算机视觉讲述

…………这个风景有点……………

在我们继续研究计算机视觉之前,很重要的一点是,让我们的人工智能同胞们戴上进化的超级护目镜,从而产生共鸣。

首先,让我们看看照片的一小块区域(约占像素的1%),然后把他放大,这样我们就可以看到单个的像素。只用你的标准视觉系统(眼睛),尽你最大的努力去辨别下面的照片片段是什么。

人工神经网络导论——计算机视觉讲述

没错,没有颜色,这有点太难了。毕竟,计算机上的大多数图像文件都存储颜色信息。

好的,那我们就出一张带颜色的。

人工神经网络导论——计算机视觉讲述

这次能看出来了吗?

人工神经网络导论——计算机视觉讲述

一辆行驶在公路上的汽车。有了完整的图像,您的视觉系统就会被场景的背景所包围,从而意识到这些小块很可能是汽车。在那之后,所有关于遗漏细节都被取消。

在上一个问题中,如果将原来是汽车的像素斑块放置在星云或湖面反射表面的图像中,则您可能已将该斑块解释为背景恒星或稀疏的云。

这表明您的大脑所做的不仅仅是将视觉信息与某些内部视觉词典匹配。您看到的每幅图像都与您以前的观看体验混合在一起。

我们所看到的事物受上下文影响的事实并未被所谓的“光学幻觉”所掩盖。这些不一致的经验提供了一种开始剥离人类视觉系统内处理层的方法。

人工神经网络导论——计算机视觉讲述

哪个圆圈的阴影为深灰色?

视觉系统选择简化或改造的东西同样令人印象深刻。

在下面的动画中,一圈洋红色斑点一次闪烁一次,因此看起来像是一个“洞”正在旋转一圈。盯着黑十字,并跟踪洋红色斑点随时间的出现情况。


分享到:


相關文章: