OCR:你不來 我不老

OCR (Optical Character Recognition,光學字符識別),簡單來說,就是終端設備藉助攝像頭,將手寫文字或印刷體文字,從圖片上摳出來,變成計算機可以識別且編輯的字符串的過程。

其實這個過程可分為兩大步驟:圖像處理and文字識別。下面,我簡單跟大家分享一下這個技術的原理。

圖像處理:

圖像處理這個過程又包含了灰度化、二值化、降噪、傾斜矯正、文字切分等子步驟。

OCR:你不來 我不老

灰度化:即將一張彩色圖片變為只有黑白兩種顏色的圖片。

OCR:你不來 我不老

二值化:就是在黑白圖片的基礎上,將圖片設定為只有純白和純黑兩種顏色,不包含灰度。

OCR:你不來 我不老

圖像降噪:一幅圖像包括目標物體、背景還有噪聲。數字圖像在數字化和傳輸過程中會受到噪聲干擾的影響,會形成零零散散的小黑點,這時候,經過降噪處理,去除小黑點,是非常重要的。

OCR:你不來 我不老

傾斜矯正:這個相信大家都好理解,拍照都會出現傾斜的問題,很難做到絕對水平。這時候需要對圖像進行矯正,來尋求一個最大程度的水平位置。

字符切分:將一段文字的每個字符切割出來,形成一個單字符,不會形成連體字,便於識別。

圖像處理完畢後,就到了我們的

文字識別:

需要提取文字的特徵,丟給分類器進行分類,它會告訴你依據這個特徵,會形成哪一個文字。最後識別出來的文字會經過最後的後處理,也就是語言模型(涉及到自然語言理解的範疇),形成“通順”的語句。

其實OCR涉及的算法很複雜,但以上,或許大家都能對OCR瞭解個三三四四。

在20世紀90年代,與清華大學的攜手合作過程中,文通科技成功地將"國家863計劃"項目成果——"文字圖像識別技術TH-OCR"產業化,才預示著與OCR與市場應用的結合。真正促使OCR技術飛速發展的是互聯網+時代的到來。

人工智能時代剛剛起步,OCR永不會老。

歡迎百度“於洪康” ,即可獲取識別開發包和測試授權,進行接口開發及軟件測試。


分享到:


相關文章: