11.25 AI中的圖像識別技術的原理及過程

伴隨著圖像處理技術的飛速發展,推動了圖像識別技術的產生和發展,並逐漸成為人工智能領域中重要的組成部分,並廣泛地運用於面部識別、指紋識別、醫療診斷等等領域中,發揮重要作用。

AI中的圖像識別技術的原理及過程

這也給學生思考課題給了更多的空間,今天小編就來淺談熱門課題方向中圖像識別技術,希望給學生更多的啟發!

圖像識別技術概述

圖像識別技術的含義

圖像識別是人工智能的一個重要領域,是指利用計算機對圖像進行處理、分析和理解,以識別各種不同模式的目標和對像的技術。一般工業使用中,採用工業相機拍攝圖片,然後再利用軟件根據圖片灰階差做進一步識別處理。

AI中的圖像識別技術的原理及過程

在具體應用實踐中,特別識別除了要弄清識別的對象具有是什麼樣的物體外,還應該明確其所在的的位置和姿態。當前圖像識別已經被廣泛應用到各個領域中,例如交通領域中的車牌號識別、交通標誌識別、軍事領域中的飛行物識別、地形勘察、安全領域中的指紋識別、人臉識別等。

AI中的圖像識別技術的原理及過程

圖像識別技術的原理

圖像識別原理主要是需處理具有一定複雜性的信息,處理技術並不是隨意出現在計算機中,主要是根據一些醫學研究人員的實踐,結合計算機程序對相關內容模擬並予以實現。該技術的計算機實現與人類對圖像識別的基本原理基本類似,在人類感覺及視覺等方面只是計算機不會受到任何因素的影響。人類不只是結合儲存在腦海中的圖像記憶進行識別,而是利用圖像特徵對其分類,再利用各類別特徵識別出圖片。計算機也採用同樣的圖像識別原理,採用對圖像重要特徵的分類和提取,並有效排除無用的多餘特徵,進而使圖像識別得以實現。有時計算機對上述特徵的提取比較明顯,有時就比較普通,這將對計算機圖像識別的效率產生較大影響。

AI中的圖像識別技術的原理及過程

圖像識別技術的過程

由於圖像識別技術的產生是基於人工智能的基礎上,所以計算機圖像識別的過程與人腦識別圖像的過程大體一致,歸納起來,該過程主要包括4個步驟:

1是獲取信息,主要是指將聲音和光等信息通過傳感器向電信號轉換,也就是對識別對象的基本信息進行獲取,並將其向計算機可識別的信息轉換;

2是信息預處理,主要是指採用去噪、變換及平滑等操作對圖像進行處理,基於此使圖像的重要特點提高;

3是抽取及選擇特徵,主要是指在模式識別中,抽取及選擇圖像特徵,概括而言就是識別圖像具有種類多樣的特點,如採用一定方式分離,就要識別圖像的特徵,獲取特徵也被稱為特徵抽取;

4是設計分類器及分類決策,其中設計分類器就是根據訓練對識別規則進行制定,基於此識別規則能夠得到特徵的主要種類,進而使圖像識別的不斷提高辨識率,此後再通過識別特殊特徵,最終實現對圖像的評價和確認。

圖像識別技術的常見形式

首先圖像識別的發展經歷了三個階段:文字識別、數字圖像處理與識別、物體識別。

文字識別的研究是從 1950年開始的,一般是識別字母、數字和符號,從印刷文字識別到手寫文字識別,應用非常廣泛。

數字圖像處理和識別的研究開始於1965年。數字圖像與模擬圖像相比具有存儲,傳輸方便可壓縮、傳輸過程中不易失真、處理方便等巨大優勢,這些都為圖像識別技術的發展提供了強大的動力。

物體的識別主要指的是對三維世界的客體及環境的感知和認識,屬於高級的計算機視覺範疇。它是以數字圖像處理與識別為基礎的結合人工智能、系統學等學科的研究方向,其研究成果被廣泛應用在各種工業及探測機器人上。

隨著計算機及信息技術的迅速發展,圖像識別技術的應用逐漸擴大到諸多領域,尤其是在面部及指紋識別、衛星雲圖識別及臨床醫療診斷等多個領域日益發揮著重要作用。通常圖像識別技術主要是指採用計算機按照既定目標對捕獲的系統前端圖片進行處理,在日常生活中圖像識別技術的應用也十分普遍,比如車牌捕捉、商品條碼識別及手寫識別等。隨著該技術的逐漸發展並不斷完善,未來將具有更加廣泛的應用領域。

AI中的圖像識別技術的原理及過程

基於神經網絡的圖像識別技術

目前,基於神經網絡的圖像識別是一種比較新型的技術,是以傳統圖像識別方式為基礎,有效融合神經網絡算法。在此,神經網絡主要是指人工神經網絡,換而言之就是本文中的神經網絡不是動物體的神經網絡,而主要是指人類採用人工模擬動物神經網絡方式的一種神經網絡。針對基於神經網絡的圖像識別技術,目前,在基於神經網絡的圖像識別技術中,遺傳算法有效結合 BP 神經網絡是最經典的一種模型,該模型可在諸多領域中進行應用。諸如智能汽車監控中採用的拍照識別技術,若有汽車從該位置經過時,檢測設備將產生相應的反應,檢測設備啟動圖像採集裝置,獲取汽車正反面的特徵圖像,在對車牌字符進行識別的過程中,就採用了基於神經網絡和模糊匹配的兩類算法。

基於非線性降維的圖像識別技術

採用計算機識別圖像是基於高維形式的一種識別技術,不管原始圖片的分辨率如何,該圖片產生的數據通常都具有多維性特徵,這在一定程度上增大了計算機識別的難度。為使計算機的圖像識別性能更為高效,採用隨圖像降維方法就是一種最直接而有效的方法。一般情況下,可對降維劃分為非線性降維與線性降維兩類,比如最普遍的線性降維方式就是主成分分與線性奇異分析等,該方式的特點是簡單、理解更容易等,再對數據集合採用線性降維方式處理求解的投影圖像使該數據集合的低維最優。

在信息技術中作為近年來新興的圖像識別技術已廣泛應用於眾多應用領域,隨著信息技術的日新月異,圖像識別技術也得到十分迅猛的發展。在眾多社會領域中,有效應用圖像識別技術將使社會與經濟價值得到充分發揮。

AI中的圖像識別技術的原理及過程

小編相信,通過本次的科普,很多同學都對圖像識別有了更深的理解,希望可以拓寬同學們的思路,利用人工智能的圖像識別技術解決更多問題,造福社會,造福世界!


分享到:


相關文章: