一種魯棒的離線筆跡鑑別方法

筆跡鑑別是指:通過機器學習方法對手寫文字信息進行關鍵特徵提取,以鑑別書寫人身份的一種文件檢驗技術。


筆跡鑑別作為機器視覺與模式識別領域的研究熱點之一,與人臉識別、語音識別、指紋識別等技術一樣屬於身份識別的研究範疇,在最近幾十年受到廣泛關注.它在司法鑑定、歷史文檔分析、商務安全等方面發揮著重要作用.


一種魯棒的離線筆跡鑑別方法

司法鑑定


一種魯棒的離線筆跡鑑別方法

歷史文檔分析


一種魯棒的離線筆跡鑑別方法

商務安全


面對這些任務,地面站難以滿足實時性和安全性要求,因此亟需提升航天器的安全自主運行能力,這是支撐測控區外自主“執行任務”的使能技術。


一種魯棒的離線筆跡鑑別方法

DLS-CNN框架圖


依據筆跡材料的獲取形式可將筆跡鑑別分為兩種,分別為在線筆跡鑑別與離線筆跡鑑別。在線筆跡鑑別可通過在線採集書寫的速度、角度、書寫者所使用的力量以及寫字的筆畫順序等豐富信息進行筆跡鑑別。離線筆跡鑑別材料使用傳統的書寫工具在紙張上書寫筆跡信息,再通過照相機或掃描儀採集為圖片的形式。本文研究的對象即為離線筆跡鑑別。然而,離線筆跡鑑別存在如下幾個客觀因素:


1)隨著年齡的增長,書寫人的書寫筆跡可能會有一定的變化;

2)同一個書寫人的材料可能來源於不同筆的使用;

3)書寫者的書寫物理環境的變化會影響書寫者的書寫習慣;

4)每個書寫者的筆跡材料與筆跡信息都非常有限。


以上幾個客觀因素使得筆跡鑑別的研究極具挑戰性。當前的筆跡鑑別方法依賴於數據增強,並需要較多的筆跡信息方可取得較好的識別效果。主要原因在於:


1)主流的基於局部特徵提取的離線筆跡鑑別方法的在數據預處理階段提取的小像素快不準確,使得很多完整的筆跡信息被錯誤分割;

2)當前基於局部特徵提取的離線筆跡鑑別方法的模型表徵能力不強,使得學習的特徵還不能充分適應筆跡鑑別任務。


為解決以上問題,並且鑑於圖像分割方法準確性與CNN在筆跡鑑別領域的成功應用,我們提出了一種基於統計的文檔行分割與深度卷積神經網絡方法(Document Line Segmentation-Convolutonal Neural Network ,簡稱DLS-CNN)。利用基於統計的文檔行分割方法分割的準確性以及深度神經網絡的強表徵能力,學習具有強魯棒性的局部特徵,使得模型在筆跡檢索任務中無需依賴於數據增強並通過取均值的編碼方式就能夠取得較好的鑑別效果,在筆跡識別中僅需要少量的筆跡信息即可對筆跡進行較好地識別.在ICDAR2013[3]與CVL[30]兩個標準數據集上實驗結果表明:1)DLS-CNN相較於其他相似方法提取的局部特徵具有更強的魯棒性;2)DLS-CNN只需要極少的筆跡信息就能對筆跡進行較好的識別,模型具有較強的泛化能力.


文章信息:陳使明, 王以松. 一種魯棒的離線筆跡鑑別方法. 自動化學報, 2020, 46(1): 108-116.


分享到:


相關文章: