AI重新定義OCR 文思海輝金融推出智能字符識別系統

在金融領域,紙質單據是最為常用的信息載體,存在大量影像文字信息錄入的需求。由於行業特殊性,單據、票據、證照的類型複雜多變,影像信息人工分類與錄入會消耗大量人力、物力和時間成本,嚴重影響業務流程的效率和用戶體驗。

文思海輝金融依託AI+OCR技術,面向銀行、保險、證券領域全力打造文字識別利器——智能字符識別系統(簡稱:ICR系統),針對金融機構不同應用場景,解決其文字識別、結構化輸出、快速適配訓練等業務痛點。

“AI+OCR”,識別不懼強幹擾


AI重新定義OCR 文思海輝金融推出智能字符識別系統

傳統的OCR識別場景中,普遍難點是對於環境干擾的處理和優化,比如印刷品上的文字壓線、汙跡等因素,可能會導致識別結果有誤。文思海輝金融ICR系統在識別過程中充分考慮了這些因素,可對識別對象進行圖像預處理,並採用自主研發的AI干擾檢測模型進行識別和去除,在強幹擾下最大可能的保障識別內容的準確性。系統蓋常見的300多種中英文字體,訓練樣本量達820萬個,英文字符識別準確率超99%,中文字符識別準確率達95%以上,極大提升了金融機構各式各樣的單據、票證識別準確率,為下游業務系統使用識別信息提供了效率和準確度的雙重保障。

標註工具,保障信息結構化輸出

AI重新定義OCR 文思海輝金融推出智能字符識別系統

金融行業因其特殊性,在單據識別字符的同時,還需要實現識別結果的結構化輸出,以滿足內部各業務系統的使用需求,這對於識別內容的結構化輸出能力提出了更高要求。文思海輝金融ICR系統包含各類模型(如:字符識別模型、文本定位模型)獨立離線部署,並提供模板標註工具,包括單據模板標註、單據分類特徵標註、單據分類,單據欄位提取、NLP校正等在內的一系列參數管理功能,方便用戶根據自身的應用場景進行適配,支持自定義新的模板並進行標註,用戶只需在系統參數中上傳模板單據,設置需要結構化的字段和欄位,通過簡單的標註即可快速實現新模板的結構化提取功能。

支持多種業務場景下的識別

開戶業務ICR系統可精準識別各類身份證件,自動進行信息結構化提取,在用戶註冊過程中快速完成身份證、護照、銀行卡等證件的識別錄入,極大提升用戶體驗。貿易金融支持貿易金融業務常見的單據識別,如國際匯款業務單據識別,出口議付/交單的常見單據識別等,並可提供智能審單功能。智能審單系統在接收到ICR識別的結構化數據後,對其進行智能化審核,並形成審核意見、審核結論,從而反饋給單據作業人員進行參考或確認。商業合同支持商業合同信息識別和智能結構化提取,包括合同中主體、風險條款、合同金額等業務要素信息,秒速完成自動定位、切割、分類、識別、輸出,是金融機構,各類型企業快速處理合同審核的好幫手。財務報表系統可以自動判斷財務報表類型,讀取報表數據,可智能匹配到用戶自定義標註的需要識別的位置、欄目、模板,並按照標準化、模塊化的形式展示識別結果,提高數據採集的效率和準確度,解決自動填入系統問題。

除此以外,文思海輝金融ICR系統還支持各類業務單據/憑證的印章提取和識別,並支持票印比對、批量增值稅發票識別和結構化提取與比對等服務,也可根據用戶具體業務場景進行定製化開發,依託敏捷的開發方式以及“AI+OCR”技術,全面提升金融機構單據、合同、證照的識別準確率與結構化輸出能力。

2019年人民銀行印發《金融科技(FinTech)發展規劃(2019-2021年)》,“人工智能”被數次提及,其重要度可見一斑。未來,文思海輝金融將持續專注金融場景探索,結合自身技術實力,助力金融機構加速創新、優化運營、助力增長、升級體驗,實現行業的精細化運營和服務升級,推動金融普惠化和場景化的創新。


分享到:


相關文章: