Python-OpenCV 18. 图像分类

本系统文章来自《机器学习实践指南 案例应用解析 第2版》学习笔记。

一、定义

图像分类利用计算机对图像进行分析,根据图像信息的不同特征,将不同类别的图像区分开来。

算法过程

  1. 准备样本图像。样本图像能代表所属类别中尽可能多的图像
  2. 提取每个样本的特征后,形成类别特征码
  3. 应用机器学习算法对类别特征码进行学习,提取特征包含的图像知识
  4. 判断未知图像所属类别

前面记录了计算图片相似度的方法,用其中部分算法,就可以实现图像分类的实现。

二、余弦相似度实现图片分类

余弦相似度通过测量两个向量内积空间的余弦值来度量它们之间的相似性,尤其适用于任何维度的向量比较中,因此属于高维空间应用较多的机器学习算法。通常来说,数字图像包含的特征码较多,而这些特征组就属于高维空间,这正是余弦相似度算法应用的范围,算法将每个图像的特征组转化为高维空间的向量,两个向量之间的角度之余弦值可用于确定两个向量是否大致指向相同的方向。

在图像分类中应用余弦相似度算法的关键在于:计算这些代表每个图像特征的向量的内积空间的夹角余弦值,从而度量图像之间的相似性。对于相似性的衡量标准有以下两种:

为相似性设置一个阈值,在这个阈值以内的都属于同一类别图像。这种标准可以将图像划分为多种类型,例如:高楼不但属于城市美景,而且属于写字楼景观。
选择与样本向量的余弦相似度最接近1的图像为该类别图像。这种标准只能将图像划分为一种类别。

1. 算法描述

特征提取一直是图像处理和计算机视觉研究领域的值得探讨的问题。如何准确定位和提取关键特征往往是首先需要需要解决的问题之一,是提高识别率等问题的重要前期准备和关键因素。目前图像特征提取算法较多,不同的算法适应于不同的图像分析任务。

本节原理: 把图像上的点分为不同的子集,这些子集往往属于孤立的点、连续的曲线或者连续的区域。将这些点按区域组成子集,提取子集的特征后,将每个子集的特征作为图像的一个特征项来进行计算。

1) 样本特征
设图像分为m个区域,每个区域有n个像素,每个像素在图像矩阵中以红、绿、蓝三色来表示,且区域特征计算方式为:
区域特征码=(∑i∈n像素i颜色的红色分量值n,∑i∈n像素i颜色的绿色分量值n,∑i∈n像素i颜色的蓝色分量值n)
区域特征码=(∑i∈n像素i颜色的红色分量值n,∑i∈n像素i颜色的绿色分量值n,∑i∈n像素i颜色的蓝色分量值n)

那么,样本特征码矩阵为3xm,即共3行m列,这3行分别代表红、绿、蓝三个分量,每列为各分量的区域特征码。
2) 类别特征
这里为每个类别准备了3个样本,类别特征的计算方式为:
类别特征码=(∑i∈n样本i颜色的红色分量特征值n,∑i∈n样本i颜色的绿色分量特征值n,∑i∈n样本i颜色的蓝色分量特征值n)
类别特征码=(∑i∈n样本i颜色的红色分量特征值n,∑i∈n样本i颜色的绿色分量特征值n,∑i∈n样本i颜色的蓝色分量特征值n)

其中,样本i是属于该类别的样本。
在计算出类别特征后,算法对样本学习完毕。当有未知图像需要分类时,首先计算其图像的样本特征,然后将样本特征和类别特征映射为高维空间的向量,最后计算这两个向量的余弦相似度,选择余弦相似度最大的类别为未知图像对应的类别。

2. 算法应用

下面的示例每个类别3个样本图像,提取类别特征码,然后将待分类图像划分到蓝天风景、树木风景、瀑布风景三个分类中。

# -*- coding: utf-8 -*-
import cv2
import numpy as np

print(u'正在处理中')
w_fg = 20
h_fg = 15
picflag = 3


def readpic(fn):
# 返回图像特征码
fnimg = cv2.imread(fn)
img = cv2.resize(fnimg,(800,600))
w = img.shape[1]
h = img.shape[0]
w_interval =int( w/w_fg)
h_interval =int( h/h_fg)
alltz = []
alltz.append([])
alltz.append([])
alltz.append([])
for now_h in range(0,h,h_interval):
for now_w in range(0,w,w_interval):
b = img[now_h:now_h + h_interval, now_w:now_w+w_interval,0]
g = img[now_h:now_h + h_interval, now_w:now_w+w_interval,1]
r = img[now_h:now_h + h_interval, now_w:now_w+w_interval,2]
btz = np.mean(b)
gtz = np.mean(g)
rtz = np.mean(r)
alltz[0].append(btz)
alltz[1].append(gtz)
alltz[2].append(rtz)
return alltz


def get_cossimi(x,y):
myx = np.array(x)

myy = np.array(y)
cos1 = np.sum(myx*myy)
cos21 = np.sqrt(sum(myx*myx))
cos22 = np.sqrt(sum(myy*myy))
return cos1/float(cos21*cos22)

# x和d样本初始化
train_x = []
d = []

# 读取图像,提取每类图像的特征
# 计算类别特征码,通过每个类别所有样本的区域特征的平均值,提取类别特征
for ii in range(1,picflag+1):
smp_x = []
b_tz = np.array([0,0,0])
g_tz = np.array([0,0,0])
r_tz = np.array([0,0,0])
mytz = np.zeros((3,w_fg*h_fg))
for jj in range(1,3):
fn = 'p'+str(ii)+'-' + str(jj) + '.png'
tmptz = readpic(fn)
mytz += np.array(tmptz)
mytz /=3
train_x.append(mytz[0].tolist()+mytz[1].tolist() + mytz[2].tolist())

# 计算目标图片的分类
# 计算待分类图像的特征码与每个类别特征码之间的余弦距离,距离最大者为图像所属分类
fn = 'test.png'
testtz = np.array(readpic(fn))
simtz = testtz[0].tolist() + testtz[1].tolist() + testtz[2].tolist()
maxtz = 0
nowi = 0
for i in range(0,picflag):
nowsim = get_cossimi(train_x[i], simtz)
if nowsim>maxtz:
maxtz = nowsim
nowi = i
print(u'%s 属于第 %d 类' % (fn,nowi+1))

运行代码,准备训练图片

p1-1.png p1-2.png p1-3.png 属于分类1
p2-1.png p2-2.png p2-3.png 属于分类2
p3-1.png p3-2.png p3-3.png 属于分类3

运行结果对给定的待分类图片test.png进行了准确的自动分类。

Python-OpenCV 18. 图像分类

三、PCA 图像特征提取算法

PCA (Principal Component Analysis),是一种掌握事物主要矛盾的统计分析方法,它可以从多元事物中解析出主要影响因素,揭示事物的本质,简化复杂的问题。
它可以用于图像矩阵降维,以降维后的矩阵为基础提取图像特征。当提取的图像特征维度比较高时,为了简化计算量以及存储空间,需要对这些高维数据进行一种程度的降维,并尽量保证数据不失真。
此外,PCA算法还可应用于图像矩阵,便于后期识别算法并进一步加工,因为图像特征组含有的不明显的特征值会影响识别的精度。
对于高维的向量,PCA方法求得一个k维特征的投影矩阵,这个投影矩阵可以将特征从高维降到低维。投影矩阵民可以叫作变化矩阵。新的低维特征必须每个维都正交,特征向量都是正交的。
通过求样本矩阵的协方差矩阵,然后注出协方差矩阵的特征向量,这些特征向量就可以构成这个投影矩阵了。特征向量的选择取决于协方差矩阵的特征值大小。
——摘自百度百科
其它还有 svm、深度学习等方式实现图片分类,后面再慢慢补充学习。


分享到:


相關文章: